Académique Documents
Professionnel Documents
Culture Documents
CFC Cours de Statistiques 2019-2020
CFC Cours de Statistiques 2019-2020
Inférentielle
Préparé par
Novembre 2019
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Avertissement
Ce document constitue une compilation des principaux résultats du cours dénommé statistique décisionnelle pour les étudiants en 3e année de
Licence en économie ou gestion. Ce polycopié ne dispense pas les étudiants de la présence aux cours, mais un simple support de cours.
Par ailleurs, il est clair que nous abordons très peu l’aspect régression, données corrélées, ou estimation non paramétrique. En effet, ces
problèmes peuvent être étudiés plus tard de manière détaillée.
Enfin, comme tout polycopié, il y a très probablement des coquilles qui subsistent. Merci de m’en faire part si vous en trouvez.
2
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
3
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Introduction
Supposons que vous travailliez pour une grande entreprise et que votre superviseur vous demande de décider
si une nouvelle version d'un smartphone doit être produite et vendue. Vous commencez par réfléchir aux
innovations et aux nouvelles fonctionnalités du produit. Ensuite, vous vous arrêtez et réalisez les
conséquences de la décision. Le produit devra générer des bénéfices, alors la tarification et les coûts de
production et de distribution sont donc très importants. La décision d'introduire le produit repose sur de
nombreuses alternatives. Alors, comment saurez-vous? Par où commencer ?
Sans avoir une grande expérience dans l'industrie, il est essentiel de commencer à développer une intelligence
qui fera de vous un expert. Vous choisissez trois autres personnes avec qui travailler et vous les rencontrez.
La conversation porte sur ce que vous devez savoir et sur les informations et données dont vous avez besoin.
Lors de votre réunion, de nombreuses questions sont posées. Combien de concurrents sont déjà sur le marché?
Comment sont évalués les smartphones? Quelles sont les caractéristiques de conception des produits concurrents? Quelles sont les
fonctionnalités requises par le marché? Que veulent les clients dans un smartphone? Qu'est-ce que les clients aiment des produits
existants? Les réponses s'appuieront sur une veille stratégique constituée de données et d'informations
collectées au moyen d'enquêtes auprès des clients, d'analyses techniques et d'études de marché. En
fin de compte, votre présentation pour étayer votre décision concernant l’introduction d’un nouveau
smartphone repose sur les statistiques que vous utilisez pour résumer et organiser vos données, les
statistiques que vous utilisez pour comparer le nouveau produit aux produits existants, et les statistiques
pour : estimer les ventes, les coûts et les revenus futurs. Les statistiques seront au centre de la
conversation que vous aurez avec votre superviseur au sujet de cette décision très importante.
En tant que décideur, la statistique intervient comme un outil pour soutenir la prise de décision. N’a de bons
arguments que celui ou celle dont le raisonnement est appuyé par des statistiques bien choisies et bien
présentées (c’est la statistique descriptive). Ne peut définir de stratégie pertinente ou ne peut prévoir efficacement
les quantités à produire, acheter ou vendre, que celui ou celle qui sait modéliser les données et en extraire les
lois des phénomènes en jeu (c’est la statistique inférentielle). Ainsi donc, l’analyse statistique appliquée aide les
managers à prendre des décisions efficientes. Le programme à aborder s’articule comme suit :
4
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Cette fonction de densité est une fonction paire, et son graphique admet l’axe des
ordonnées comme axe de symétrie. Il y a un maximum pour qui correspond au
mode de cette distribution. Compte tenu de deux points d’inflexion, le graphique est
simple à tracer et présente l’allure caractéristique connue sous le nom de courbe en
cloche.
est une fonction de densité, car
C'est-à-dire que
Or
Fonction paire :
Maximum pour
Points d’inflexion :
Fonction symétrique
Cette distribution de probabilité possède une moyenne égale à 0. Le graphique étant
symétrique par rapport à l’axe des ordonnées (parité de la densité), on a une surface
totale (égale à 1) comprise entre la courbe et l’axe des abscisses, partagée en deux
parties égales par l’axe vertical (soit 0,5 à gauche et 0,5 à droite). La médiane de cette
distribution est aussi égale à 0. Enfin, le sommet de la « cloche » est au point x = 0 .
5
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Moments :
6
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
∗
≥ = 1− ∗
<
∗
≤− = ∗
≥ =1− ∗
<
∗
≥− = ∗
≤
≤ ∗
≤ = −
0≤ ∗
≤ 1.2 ; −0.9 ≤ ∗
≤0 ; 0.3 ≤ ∗
≤ 1.56 ; −0.2 ≤ ∗
≤ 0.2
∗
≤ = 0.5; ∗
≤ = 0.8749; ∗
≥ = 0.117; ∗
≥ = 0.617
Définition :
Une variable aléatoire réelle , prenant ses valeurs dans , suit une loi de Laplace-
Gauss ou loi normale, de paramètres et , si sa densité de probabilité est
donnée par :
Fonction de répartition
Cette intégrale n’ayant pas d’expression mathématique simple, des tables donnent les
valeurs de la fonction de répartition.
Moments
Espérance mathématique et variance
7
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Propriété 1
Si est une variable aléatoire normale, alors toute fonction du 1er degré (fonction
affine) de suit aussi une loi normale.
Soit une variable aléatoire distribuée selon une loi normale , la variable
aléatoire suit aussi une loi normale avec et
(l’écart type de valant ).
Propriété 2
Si on a variables aléatoires normales et indépendantes, alors leur somme
suit une loi normale . Avec
8
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
─ Introduction
La problématique de l’inférence statistique consiste, à partir d’un échantillon de données provenant d’une
population de caractéristiques inconnues, à déduire des propriétés sur la population en contrôlant au mieux
le risque de se tromper.
Le problème général est le suivant : on souhaite étudier une caractéristique (appelée aussi caractère ou
variable statistique) associée à des individus appartenant à une population. Rappelons qu'une population est un
ensemble, fini ou non, d'éléments que l'on souhaite étudier. Il peut s'agir par exemple d'êtres humains (adultes, enfants,
chômeurs, salariés, etc.), d'animaux ou encore d'objets (entreprises, voitures, ordinateurs, incendies, accidents,
etc.). La caractéristique étudiée peut être qualitative (par exemple la catégorie socio-professionnelle de
1'individu : cadre, employé, etc.) ou quantitative (par exemple la taille ou le salaire de l’individu). Pour mener à
bien cette étude, la statistique propose deux solutions : le recensement et l'échantillonnage.
Un recensement consiste à mesurer, ou observer, la (ou les) caractéristique(s) d'intérêt de façon exhaustive pour tous les
individus de la population. Une telle solution n'est bien évidemment applicable que lorsque la taille de la
population étudiée est relativement faible. Dans la plupart des cas, il est nécessaire de recourir à la seconde
solution: l'échantillonnage.
L'échantillonnage se définit comme la méthode de construction d'un échantillon, qui est un sous ensemble
de la population. Au sens strict, un échantillon consiste en une collection d'individus sélectionnés dans la
Quel est l'intérêt de constituer un échantillon ? L'idée est d'étudier les caractéristiques d'intérêt pour les
individus sélectionnés dans l'échantillon afin d'en tirer de l'information sur ces mêmes caractéristiques pour
l'ensemble de la population. Par conséquent, d'un côté la dimension de l'échantillon doit être suffisamment
importante pour que l'on puisse obtenir une information fiable sur la population, mais d' un autre côté elle
doit être la plus petite possible afin de limiter le coût de l'enquête.
Une question se pose à ce stade : comment choisir les individus qui composent l'échantillon ? La
réponse à une telle question renvoie aux différentes méthodes d’échantillonnage.
9
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
─ Méthodes d’échantillonnage
statistique. On associe alors à chaque individu ! une variable aléatoire X i , dont on observe une seule
Un échantillonnage correspond à des tirages indépendants et équiprobables d’individus au sein de la population
réalisation xi .
Il y a plusieurs manières de choisir un échantillon d’une population, qu’on peut regrouper dans deux
catégories :
─ Échantillonnage non aléatoire (ou déterministe),
─ Échantillonnage aléatoire
Échantillonnage non aléatoire (ou sur la base du jugement)
Dans ce cas, le statisticien ou l’analyste utilise son expérience et ses connaissances personnelles pour choisir
les unités statistiques devant faire partie de l’échantillon pour avoir un échantillon représentatif de la
population statistique.
─ par quota (reproduire les caractéristiques de la population statistique)
─ de convenance (les unités sont faciles à toucher ou à contacter)
─ selon le jugement du statisticien
─ boule de neige (un répondant de référer à un autre qui présente les mêmes caractéristiques)
Échantillonnage aléatoire
Un échantillon aléatoire est obtenu en utilisant un mécanisme probabiliste, de telle sorte que l’on connait par
avance la probabilité qu’une unité donnée de la population soit incluse dans l’échantillon. Pour obtenir un
échantillon représentatif de la population, il faut procéder par échantillonnage aléatoire. Cette forme
d’échantillonnage permet de calculer précisément l’erreur due à l’échantillonnage et par conséquent, de juger
de la valeur de l’information partielle ainsi obtenue. Les techniques utilisées en statistique inférentielle
reposant sur des concepts probabilistes, l’information que techniques utilisent comme élément de base doit
absolument provenir d’un échantillon aléatoire. Selon Dagnelie (1998), « un échantillon est dit aléatoire quand tous
les individus de la population ont une même probabilité de faire partie de l'échantillon ». Parmi les diverses méthodes
utilisées pour obtenir un échantillon aléatoire, les principales sont les suivantes : l’échantillonnage aléatoire simple,
l’échantillonnage stratifié, l’échantillonnage par grappes, et l’échantillonnage systématique.
─ Échantillonnage aléatoire simple : un échantillon est dit aléatoire simple si il est choisi par un
processus de sélection de objets d’une population de sorte que chaque membre de la population ait
la même probabilité d’être sélectionné, la sélection d’un membre de la population étant indépendante
de la sélection de tout autre membre, et chaque échantillon possible de taille a la même probabilité
d’être choisit.
Les échantillons aléatoires sont idéals. Il est souvent important que l’échantillon soit représentatif de la
population. L’échantillonnage aléatoire est l’assurance contre les biais pouvant influencer la sélection des
échantillons. Dans la pratique, les analystes développent des méthodes d’échantillonnage alternatives
pour minimiser le cout de l’échantillonnage. Mais la base pour savoir si ces méthodes alternatives soient
acceptables, c’est lorsqu’elles aboutissent aux résultats sont proches de l’échantillonnage aléatoire simple.
─ Échantillonnage aléatoire stratifié : la population est découpée en sous populations (strates)
homogènes. Les individus sont ensuite sélectionnés de manière aléatoire dans chaque strate.
10
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
─ Distribution d’échantillonnage
population, telle que la moyenne de la population, " en utilisant une statistique de l’échantillon, comme la
Considérons un échantillon aléatoire qui est utilisé pour faire une inférence sur certaines caractéristiques de la
moyenne de l’échantillon ̅ . On constate que chaque échantillon a différentes valeurs observées, et donc
différentes moyennes de l’échantillon. La distribution d’échantillonnage de la moyenne de l’échantillon est la
distribution de probabilité des statistiques des échantillons obtenues de tous les échantillons possible ayant le
même nombre d’observation issus de la population.
quatre individus $ = 4 : Pierre, Paul, Jacques et Jean. On suppose que leurs poids exprimés en
Notons le poids d'un individu, supposé déterministe, et imaginons que notre population soit constituée de
= 65 ; = 73 ; = 82 ; = 68
kilogrammes sont respectivement égaux à :
%&'((' )'*+ %*,- )*./,'0
On obtient un total de 06 échantillons avec une probabilité de 1/6 d’être sélectionné pour chacun. En
fonction de l’échantillon choisi, la moyenne empirique se présente comme une variable aléatoire. Dans ce cas
11
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Le tableau suivant présente des résultats similaires pour un échantillon de taille = 3 issu de la même
Dans ces exemples, il a été possible de définir tous les échantillons possibles étant donné la taille de la
population et de l’échantillon. Et pour chaque échantillon possible, la moyenne empirique a été calculée, et la
distribution de probabilité a été construite.
De ces exemples simples, on voit que lorsque la taille de l’échantillon devient grande, la distribution de la
moyenne empirique – distribution d’échantillonnage – devient plus concentrée autour de la moyenne de la
population. Dans la plupart des travaux statistiques, les populations sont très grandes, et il n’est souvent
pas rationnel de construire la distribution de tous les échantillons possibles d’une taille donnée. Mais en
utilisant ce qu’on a appris sur les variables aléatoires, on peut montrer que les distributions d’échantillonnage
pour les échantillons de toutes populations ont des caractéristiques similaires que celles qu’on a montré dans
les exemples simples de population discrète.
Soit Soit un échantillon aléatoire de observations issu d’une très grande population de moyenne " et de
(empirique)
variance 2 3 ; les observations d’échantillon sont les variables 4, 3 , ⋯ + . Avant que l’échantillon ne soit
observations individuelles comme des variables aléatoires d’une population de moyenne " et de variance 2 3 .
observé, il y a une incertitude par rapport aux résultats. Cette incertitude est modélisé en considérant les
Soient les variables aléatoires 4, 3 , ⋯ + d’un échantillon issu d’une population. La valeur de la moyenne de
Moyenne de l’échantillon
+
1 1
l’échantillon de ces variables aléatoires est définie par
7= 8 & = 4 + 3 + ⋯+ +
&94
Considérons la distribution d’échantillonnage de la variable 7 . À ce point, on ne peut pas déterminer la forme
de la distribution d’échantillonnage, mais on peut déterminer la moyenne et la variance de la distribution
d’échantillonnage à partir des définitions basiques vues dans les cours de probabilités.
12
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Étant une variable aléatoire, cette moyenne n’est rien d’autre que l’espérance mathématique de 7 .
Moyenne de la moyenne de l’échantillon (empirique)
+
1 1 "
:; 7 < = : = 8 &> = :? 4 + 3 +⋯+ + @= ="
&94
L’espérance mathématique d’une combinaison linéaire de variables aléatoires est une combinaison linéaire des espérances
Ainsi, l’espérance mathématique de la moyenne empirique ou de l’échantillon est la moyenne de la
population. Si les échantillons de n observations aléatoires sont indépendamment et identiquement tirés d’une
population, alors lorsque le nombre d’échantillons devient grand, la moyenne des moyennes de l’échantillon
approche la vraie valeur de la moyenne de la population. Une seule moyenne de l’échantillon peut être plus
grande ou plus petite que la moyenne de la population. Cependant, en moyenne, il n’y a pas de raison d’espérer la
moyenne de l’échantillon plus grand ou plus petit que la moyenne de la population.
Exemple :
Dans l’exemple des échantillons de 2 individus sur 4, on peut calculer l’espérance mathématique de la variable
1 1 1
aléatoire comme suit :
:; 7 < = 8 ̅ ̅ = 69 A B + 73.5 A B + ⋯ + 75 A B = 72
6 6 6
Ce résultat donne la moyenne de la population ".
+ +
1 1 1 1 1 23 23
par la variance des variables aléatoires. Il s’en suit que :
3
C D; 7 < = C D = 8 &> = C D ?A 4 + 3 + ⋯+ + B@ = 8A B 2&3 = 3
=
&94 &94
La variance de la distribution d’échantillonnage de 7 décroit lorsque la taille de l’échantillon augmente. En
effet, cela veut dire que les échantillons de grandes tailles entrainent beaucoup plus de distributions
d’échantillonnage concentrées. L’exemple simple dans la section précédente démontre ce résultat. Ainsi, les
population. La variance de la moyenne de l’échantillon est notée : 2E̅3 et l’écart type correspondant est donné
grands échantillons donnent de plus grande certitude par rapport à l’inférence de la moyenne de la
2
par :
2E̅ =
√
Cela correspond au cas où la population mère est finie et l’échantillon est non exhaustif (tirage avec remise)
Lorsque la taille de l’échantillon n’est pas une petite fraction de la taille de population $, alors les membres
ou si la population est infinie, que l’échantillon soit ou non exhaustif.
individuels de l’échantillon ne sont pas distribués indépendamment. On peut montrer dans ce cas que la
variance de la moyenne de l’échantillon est comme suit :
13
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
23 $ −
C D 7 =
$−1
GH+
GH4
Où le facteur est appelé facteur d’exhaustivité ou facteur de correction de la population finie. Ce cas
s’applique lorsque la population mère est finie (avec n N > 1 20 ) et l’échantillon exhaustif (tirage sans
remise).
On verra qu’avec des analyses additionnelles, ces résultats peuvent devenir très puissants pour certaines
applications pratiques. On analyse d’abord ces résultats sous l’hypothèse selon laquelle la population sous-
jacente a une distribution de probabilité normale. Ensuite, nous explorons la distribution d’échantillonnage de
la moyenne d’échantillon lorsque la population sous-jacente n’a pas une distribution normale. Ce second cas
va fournir des résultats puissants pour beaucoup d’applications pratiques en économie et en gestion.
, variables aléatoires indépendantes suivant toutes la même loi normale $ ", 2 . Pour
Un cas particulier
, on a : = ". Donc
Soit
tout
+
23 2
C ̅ = ⟹ 2E̅ =
√
Les variables aléatoires étant indépendantes et suivant une loi normale, leur somme
suit une loi normale et ̅ = + ∑+&94
4
& suit également une loi normale.
possède la variable aléatoire ̅ lorsque l’hypothèse de normalité des variables n’est plus satisfaite.
Comme on ne rencontre pas toujours des variables normales, il est nécessaire d’étudier quelle propriété
Exemple 1 :
Supposons qu’en se basant sur les données historiques, on croit que l’augmentation du pourcentage annuel de
salaire des directeurs des moyennes entreprises est normalement distribué avec une moyenne de 12.2% et
d’écart-type de 3.6%. Un échantillon aléatoire de 9 observations est obtenu de cette population, et la
moyenne de l’échantillon est calculée. Quelle est la probabilité que cette de l’échantillon soit supérieur à
14.4% ?
Exemple 2 :
Le fabricant de bougie (moteur) déclare que la durée de vie de ses bougies est normalement distribuée avec
une moyenne de 60 000 miles et l’écart-type est de 4 000 miles. Un échantillon aléatoire de 16 bougies a une
durée de vie moyenne de 58 500 miles. Si la déclaration du fabricant est correcte, quelle est la probabilité de
trouver la moyenne de l’échantillon égale à 58 500 ou moins ?
Solution :
2 4000
Pour calculer la probabilité, on calcule d’abord l’écart type de la moyenne de l’échantillon.
2E̅ = = = 1 000
√ √16
Exercice :
Une machine automatique produit des pièces dont le poids moyen est 5 grammes avec un écart-type de 0.25
grammes. Le responsable de la production désire contrôler le poids de ces pièces et prélève à cet effet 100
pièces, à intervalles réguliers. Calculer la probabilité que la moyenne de cet échantillon soit au plus égale à 5.01 grammes.
échantillons (V < WX
5. Distribution d'échantillonnage de la moyenne empirique de petits
Pour les grands échantillons, Le théorème central limite nous dit que ̅ suit approximativement une loi
normale. Lorsque la taille de l'échantillon n'est pas grande pour appliquer le théorème central limite, la
population devra satisfaire certaines conditions telles que la normalité de la population.
Si la population est normalement distribuée, alors:
15
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
si 2 est connu, on a
̅−" ̅−" ̅−"
O= = 2 → $ 0, 1 ⟺ √ A B → $ 0, 1
2E̅ 2
√
si 2 est inconnu, on l'estime en utilisant les données de l'échantillon. Dans ce cas la loi devient une loi
de Student à − 1 degré de liberté (table 3 annexe).
moyenne "4 R "3 , et de variances 243 R 233 respectivement. On s’intéresse à la différence "4 − "3 , pour
Elle est utile lorsqu’il s’agit de comparer les moyennes de deux populations. Soient deux populations de
ce faire, on extrait deux échantillons aléatoires indépendants de tailles 4 R 3 de chaque population. Soient
̅4 R ̅3 les moyennes empiriques de chaque échantillon.
\ − "4 − "3
Dans ce cas les variables centrées réduites sont obtenues,
→ $ 0, 1 b! 243 R 233 bP R P Q b
23 23
d 4 + 3
4 3
\ − "4 − "3
Ou
→ $ 0, 1 b! 243 R 233 bP R ! P Q b
b3 b33
d 4 +
4 3
Note : lorsque 243 R 233 bP R ! P Q b on les remplace par les variances empiriques (ou des
Cas 2 : lorsque les échantillons sont de petites tailles, c'est-à-dire 4 , 3 < 30 , on suppose que les
échantillons).
populations sont normales et les écart-types sont inconnus. On utilise la loi de Student à la place de la loi
Les écart-types sont inconnus mais supposés être égaux 243 = 233
normale.
─
16
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
\ − "4 − "3
→ R +` g+aH3; h
bf3 bf3
d +
4 3
− 1 b43 + 3 − 1 b33
bf3 =
4
4+ 3−2
\ − "4 − "3
→ R j; h
b43 b43
d +
4 3
b43 b33
3
avec
? + @
= 4 3
b43 ⁄ 4 b3⁄ 3 3
+ 3 3
4−1 3−1
nombre entier directement supérieur. Si par exemple = 17.35 alors le degré de liberté est de 18.
Note : dans la plupart des cas, le calcul du degré de liberté donne une valeur fractionnelle. Dans la pratique, on utilise le
Exercice :
Une société produit des briquets dans deux unités : A et B. ceux produits par l’unité A permettent 150
allumages en moyenne avec un écart-type de 20 allumages. Les briquets produits par B assurent 140 allumages
en moyenne avec un écart-type de 15 allumages. Le contrôleur de la société prélève 150 briquets de A et 200
briquets de B.
Calculer la probabilité que le nombre moyen d’allumages des briquets de l’échantillon de A soit supérieur de
plus de 15 au nombre moyen d’allumages de l’échantillon provenant de B.
paramètre est la proportion des membres de la population ayant la caractéristique d’intérêt. On définit la
proportion d’échantillon (empirique, ou encore fréquence observée) comme
m=
probabilité de succès l . comme résultat, m est la moyenne d’un ensemble de variables aléatoires
est la somme d’un ensemble de variables aléatoires indépendantes de Bernouilli, chacune avec la
De plus, le théorème central limite peut être utilisé pour argumenter que la distribution de probabilité de m
indépendantes, et les résultats développés précédemment pour les moyennes de l’échantillon restent valable.
17
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
:; < = l, C D = l 1−l
obtenues à partir de la moyenne et la variance du nombre de succès de .
1
Ainsi,
:;m< = : ? @ = :; < = l
On constate donc que la moyenne de la distribution de m est la proportion de la population l.
La variance de m est la variance de la distribution de la population des variables de Bernouilli divisée par .
1 l 1−l l 1−l
2n3 = C D A B = 3
C D = → 2n = d
m−l
Et si la taille de l’échantillon est grande, on a :
O=
→ $ 0, 1
2n
Cette approximation est valide si l 1 − l > 5. Parfois de manière plus rigoureuse, on valide si l ≥ 10 et
1 − l ≥ 10. Cela dans le cas où, la population mère est finie et l’échantillon est non exhaustif
(tirage avec remise) ou si la population est infinie, que l’échantillon soit ou non exhaustif, la variable
aléatoire F a pour caractéristique.
Mais si la population mère est finie (avec n N > 1 20 ) et l’échantillon exhaustif (tirage sans remise),
les caractéristiques doivent subir une correction d’exhaustivité. Ainsi, l’écart-type devient :
pq N − n
σF = .
n N −1
Exemple 1 :
Une élection a eu lieu et un candidat a eu 40 % des voix. On prélève un échantillon de 100 bulletins de vote.
Quelle est la probabilité que, dans l'échantillon, le candidat ait entre 35 % et 45 % des voix ?
Nous avons = 100 R l = 0,4. La variable aléatoire m correspondant à la fréquence des votes pour le
Solution
0, 4*0, 6 0, 24
F a N 0, 4; = N 0, 4;
100 100
Posons x = 62.5675 (x − x ) = 0.6498
2
i
2
18
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Un échantillon aléatoire de 270 maisons a été tiré d’une grande population de vieilles maisons pour estimer la
proportion de maison avec câblage électrique dangereux. Si en fait, 20% de maison a un câblage dangereux,
quelle est la probabilité pour que la proportion empirique sera entre 16%et 24% ?
Solution
l = 0.20 R = 270
On peut donc calculer l’écart type de la proportion d’échantillon m comme suit :
016 − l m − l 0.24 − l
0.16 < m < 0.24 = A < < B
2n 2n 2n
0.16 − 0.20 0.24 − 0.20
A <O< B
0.024 0.024
−1.67 < O < 1.67 = 0.9050
Exercice :
Le responsable du service abonnement d’une chaîne de télévision codée constate que 2% des abonnés
résilient leur contrat au terme d’un an. Le directeur de la chaine prélève un échantillon aléatoire de 200
abonnés. Calculer la probabilité que le nombre de résiliations au terme de l’année soit supérieur à 4%. Calculer la probabilité
que ce nombre soit au plus égal à 1%.
Chacune des deux populations fournie respectivement les proportions l4 et l3 . Pour arriver à les comparer,
Dans cette section, on développe la procédure pour comparer deux proportions de populations statistiques.
l4 1 − l4 l3 1 − l3
\ → $ c l4 − l3 , d + e
4 3
o4 − o3 − l4 − l3
alors
O= → $ 0, 1
l4 1 − l4 l3 1 − l3
^ +
4 3
Exercice (sch401)
On suppose qu’un fabricant dispose deux usines. Avec des observations sur une longue période, il est connu
que approximativement 4% et 2.5% de pièces défectueuses sont produit sur ces deux sites. Des échantillons
de 200 pièces sont sélectionnés sur une production hebdomadaire dans chaque usine. Quelle est la probabilité
que les proportions d’échantillons diffèrent de plus de 2% ?
19
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
moyenne inconnue " et de variance inconnue 2 3 . On note les membre de l’échantillon comme 4 , 3 , ⋯ , + .
On commence par considérer un échantillon aléatoire de observations issu d’une population avec une
2 3 = :; − " 3<
La variance de la population est l’espérance :
Ce qui suppose qu’on considère la moyenne de & − ̅ 3 sur observations. Comme " est inconnu, on
utilise la moyenne de l’échantillon ̅ pour calculer la variance de l’échantillon.
4, 3, ⋯ , + ,
9.1. Variance empirique
Soient les observations d’un échantillon aléatoire issu d’une population. La quantité
+
1
b3 = 8 − ̅ 3
−1 &
&94
est appelée variance empirique corrigée, et sa racine carrée, l’écart type empirique. Étant donné un échantillon
spécifique, on peut calculer la variance empirique corrigée, et elle sera différente pour chaque échantillon
On peut être initialement surpris par l’utilisation de − 1 comme diviseur dans la formule précédente. Une
aléatoire à cause de la différence entre les observations des échantillons.
explication simple est que dans un échantillon aléatoire de observations, on a différentes valeurs
seulement − 1 différentes valeurs qui peuvent être uniquement définies. De plus, on peut montrer que la
indépendantes ou degré de liberté. Mais après avoir connu la valeur calculée de la moyenne empirique, il y a
:;b 3 < = 2 3
valeur espérée de la variance empirique calculée de cette manière est la variance de la population.
La conclusion selon laquelle la valeur espérée de la variance empirique est la variance de la population est un
résultat d’ordre général. Mais pour l’inférence statistique, on aimerait connaitre d’avantage par rapport à la
distribution d’échantillonnage. Si on peut supposer que la distribution de la population sous-jacente est
normale, alors on peut montrer que la variance empirique et la variance de la population sont reliées à travers
une distribution de probabilité connue sous la distribution de Chi-deux ou Khi-deux.
variance de la population est 2 3 et la variance empirique résultante est b 3 , on peut montrer que :
Étant donné un échantillon aléatoire de observations issu d’une population normalement distribuée dont la
− 1 b 3 ∑+&94 & − ̅ 3
p 3+H4 = =
23 23
a une distribution connu sous la distribution de Chi-deux p 3 avec − 1 degré de liberté. Elle correspond à
une distribution de la somme des carrées de − 1 variables aléatoires normales centrées et réduites
indépendantes. Cette distribution et les probabilités qui en découlent exigent que la population sous jacente
soit normale.
20
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Cette distribution est définie uniquement pour des valeurs positives étant donné que les variances sont toutes
positives. La fonction de densité est asymétrique avec une longue queue positive.
Graphique d’une loi de
q, r q, 3q
référant au degré de liberté noté s (Upsilon). Une distribution de Chi-deux avec s degré de liberté est notée
On peut caractériser un membre particulier de la famille de distributions Chi-deux par un seul paramètre se
p 3t . La moyenne et la variance de cette distribution sont égales au nombre de degré de liberté et deux fois le
nombre de degré de liberté.
:up 3t v = s R C Dwp 3t x = 2s
− 1 b3
En utilisant ces résultats pour la moyenne et la variance de Chi-deux, on trouve que :
:y z= −1
23
−1
:;b 3 < = −1
23
:;b 3 < = 2 3
Pour obtenir la variance de b , on a
3
− 1 b3
C DT U=2 −1
23
− 1 3b3
C D b3 = 2 − 1
2{
22 {
C D b = 3
−1
comparer les variances des populations. Une telle comparaison se fait en estimant le ratio 243 ⁄233 .
Lorsque deux échantillons issus des populations normalement distribuées, il est souvent intéressant de
tailles 4 R 3 donnant des variances empiriques b43 R b33 . Si les populations en question ont pour
Soient deux échantillons aléatoires indépendants issus des distributions normales avec respectivement les
21
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
avec s4 = 4 − 1 et s3 = 3 −1
Graphique de la densité de la loi de Fisher
Les Tables en annexe 4 désignent les probabilités de la queue droite c'est-à-dire de la forme:
mh; t`, ta
1
m4Hh; =
t`, ta
mh; ta, t`
1 1
m .4 = 1.92; m .4 = 1.84, m = = = 0.54
; 3 ,4q ; 4q,3 .r ; 3 ,4q
m .4 ; 4q,3 1.84
22
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Chapitre 3 : Estimation
─ Théorie de l’estimation
1.1. Exposé du problème
Un aspect important de l’inférence statistique consiste à obtenir des estimations fiables des caractéristiques d’une
population à partir d’un échantillon extrait de cette population. C’est un problème de décision concernant des
paramètres tels que :
─ l’espérance mathématique notée m ou µ (pour un caractère mesurable),
─ la variance ou l’écart-type notée σ ,
─ la proportion p (pour un caractère dénombrable).
Comme un échantillon ne peut donner qu’une information partielle sur la population, les estimations ainsi
obtenues seront inévitablement entachées d’erreurs que l’on doit minimiser autant que possible. En résumé :
Estimer un paramètre, c’est donner une valeur approchée de ce paramètre, à partir des résultats obtenus
sur un échantillon aléatoire extrait de la population.
X est une variable aléatoire dont la fonction de répartition F ( x;θ ) et la densité f ( x;θ ) dépendent du
paramètre θ ; Dθ est l’ensemble des valeurs possibles de ce paramètre.
On considère un échantillon de taille n de cette variable X = ( X 1 ,K , X n ) . Une statistique est une fonction
mesurable T des variables aléatoires X i . :
T = Φ ( X 1 , X 2 ,LL , X n )
À un échantillon, on peut associer différentes statistiques. La théorie de l’estimation consiste à définir des
statistiques particulières, appelées estimateurs.
Une fois l’échantillon effectivement réalisé, l’estimateur prend une valeur numérique, appelée estimation du
23
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Exemple :
Soit X la statistique :
1 n
X = T ( X 1 ,K , X n ) = Xi
n i =1
2. Estimation ponctuelle
Le but de la théorie de l’estimation est de choisir, parmi toutes les statistiques possibles, le meilleur
estimateur, c’est-à-dire celui qui donnera une estimation ponctuelle la plus proche possible du paramètre et
ceci, quel que soit l’échantillon.
La quantité E (T ) − θ est le biais de l’estimateur. Un estimateur est sans biais si. : Z = |. Un estimateur est
biaisé si E (T ) ≠ θ . Un estimateur est asymptotiquement sans biais si E (T ) → θ quand la taille n de
l’échantillon tend vers l’infini.
24
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Souvent, |} surestime ou sous estime le paramètre, mais il s’en suit de la notion d’espérance que, si la
procédure d’échantillonnage se répète plusieurs fois, alors, en moyenne, la valeur obtenue à partir d’un
estimateur non biaisé serait égal au paramètre de la population. Il semble raisonnable d’affirmer que, toutes
choses égales par ailleurs, cette propriété est désirable pour un estimateur.
La figure suivante illustre les fonctions de densité de probabilité de deux estimateurs, |}4 R |}3 de |.
Exemple 1 : comparaison d’ordre général
Dans le graphique de gauche, il est évident que |}4 est un estimateur sans biais de |, alors que, |}3 est un
estimateur biaisé de |. Dans le graphique de droite, les estimateurs |}4 R |}~ sont tous sans biais, le choix
entre les deux devra donc être basé sur d’autres critères (variance par exemple).
Exercice 1 : montrer que la variance empirique corrigée b 3 est un estimateur sans biais de la variance de la
population 2 3 , c'est-à-dire : [ 3 = 2 3 .
b. Estimateur efficace
Dans plusieurs problèmes pratiques, différents estimateurs non biaisés peuvent être obtenu et les méthodes
de choix parmi eux devraient être trouvées. Dans cette situation, il est naturel de préférer l’estimateur dont la
distribution est beaucoup plus concentrée autour du paramètre de la population à estimer. Les valeurs d’un tel
estimateur sont beaucoup moins différentes de toute autre quantité fixe, à partir du paramètre à estimer que
pour les autres. En prenant la variance comme mesure de concentration, l’efficacité d’un estimateur comme
critère de préférence d’un estimateur est introduite.
variance est appelé estimateur plus efficace (efficace) ou estimateur sans biais à variance minimale. Soient |}4 R |}3 deux
S’il y a plusieurs estimateurs sans biais d’un paramètre, alors l’estimateur sans biais ayant la plus petite
estimateurs sans biais de |, basés sur les mêmes nombres d’observations d’échantillon.
‡ ‚ est dit plus efficace que †
† ‡ • si ˆ‰Š †
‡ ‚ < ˆ‰Š †
‡•
25
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Exemple : supposons 4 , ⋯ , q un échantillon aléatoire issu d’une population avec : & = " et C & =
2 3 , ! = 1, ⋯ ,5. Soient les estimateurs proposés pour la moyenne de la population ".
1 1 1
"̂ 4 = 4; "̂ 3 = 4 + q ; "̂ ~ = +2 ; "̂ { = ̅ = +⋯+
2 2 4 q
5 4 q
3
Solution
Œ[: Z = :; Z − | 3 <
différence entre les estimateurs et les paramètres est utilisé comme mesure de la précision.
Œ[: Z = C D Z + ;: Z − |<3
centrée), on obtient :
Pour rendre l’erreur quadratique moyenne (MSE) la plus petite possible, il faut que :
─ E (T ) = θ , donc choisir un estimateur sans biais,
─ var (T ) soit petite.
En particulier, si Z est sans biais, alors Œ[: Z = C D Z . Soient Z4 R Z3 deux estimateurs de |. On dira
que Z4 bR lŽQb oo! •Q Z3 si Œ[: Z4 ≤ Œ[: Z3 . Et si Z4 R Z3 sont sans biais, alors cela est
équivalent à : C D Z4 ≤ C D Z3 .
Parmi les estimateurs sans biais, on choisira donc celui qui a la variance la plus petite, cette propriété traduit
l’efficacité de l’estimateur.
Exemple : on considère |}4 R |}3 deux différents estimateurs de |. L’estimateur |}4 est sans biais, alors que
:w|}3 x = 7| ⁄2. On sait de plus que Cw|}4 x = 8 et Cw|}3 x = 5. Lequel des deux estimateurs est meilleur pour
estimer | ? Dans quel sens est-il meilleur ?
26
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Comme l’espérance :w|}3 x = 7| ⁄2, |}3 est un estimateur biaisé de |. Alors on ne peut pas comparer les
Solution
variances pour déterminer lequel entre |}4 R |}3 est le meilleur estimateur de |. Par contre pour comparer les
deux estimateurs, on peut utiliser le Œ[: des deux estimateurs.
Comme |}4 est sans biais, Œ[:w|}4 x = Cw|}4 x = 8
•! !bw|}3 x = :w|}3 x − | = 7| ⁄2 − | = 5| ⁄2
On peut dire que |}4 est un meilleur estimateur que |}3 si Œ[:w|}4 x < Œ[:w|}3 x, ce qui serait le cas si 8 <
5 + 5| ⁄2 3. En d’autres termes, si | 3 > 12⁄25. Ainsi, dans le sens de Œ[:, on conclut que :
|}4 est meilleur estimateur de | que |}3 pour | < −•12⁄25 ou | > •12⁄25
|}3 est meilleur estimateur de | que |}4 pour −•12⁄25 < | < •12⁄25
─
─
d. Estimateur convergent
La propriété de convergence d’un estimateur est relative à son comportement lorsque la taille de l’échantillon
devient grande. Une statistique est un estimateur convergent d’un paramètre de la population si, lorsque la
taille de l’échantillon augmente, il devient presque certain que la valeur de la statistique est beaucoup plus
∀” > 0, lim |Z − || ≤ ” = 1
Ou
+→˜
On note T P
n →∞
→θ
+→˜
tend vers l’infini (c'est-à-dire C D Z š⎯⎯œ 0), alors Z
─
+→˜
converge en probabilité vers | lorsque tend vers l’infini (donc • est un estimateur
et si sa variance tend vers zéro lorsque
convergent de †).
Si Z est un estimateur sans biais du paramètre | au lieu de asymptotiquement sans biais, on dit
que • est un estimateur absolument convergent de †
─
27
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
žw ; |x = Ÿ & = & ||
&94
+
si est une variable aléatoire discrète, et par
žw ; |x = Ÿ o &; |
&94
Si est une variable aléatoire continue de densité o ;| .
= | 1−| 0≤|≤1
Exemple 1 : fonction de densité de loi binomiale
E¡ 4HE¡
o &; |
0 b! P
+ +
žw ; |x = Ÿ = & || = Ÿ | E¡ 1 − | = | ∑ E¡ 1 − |
4HE¡ ∑ 4HE¡
&
&94 &94
−¥ 3 1 1
Exemple 2 : fonction de densité de la loi normale
o & ; ¥; 2 = ¤ ¨ l §− £
&
2√2¦ 2 2
+
1 + 1
žw ; |x = Ÿ o & ; | = A B l §− 3 8 & − ¥ 3 ¨
2√2¦ 22
&94
1
Lnžw ; |x = − Ln 2¦2 3 − 3 8 & − ¥ 3
2 22
Information de Fischer
La quantité d’information apportée par un échantillon est l’expression suivante sous réserve de l’existence de
l’intégrale :
28
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
dLnžw ; |x
3
dLnžw ; |x
3
= - =T U > žw ; |xd
®¯ d|
Si l’ensemble :° une dépend pas de | et si la vraisemblance žw ; |x est dérivable au moins jusqu’à l’ordre
deux, la quantité d’information de Fisher possède les propriétés suivantes :
dLnžw ; |x
bR Q D! Ž Žé RP!D RDé
d|
dLnžw ; |x
ª+ | = C D y z
d|
d3 Lnžw ; |x
ª+ | = −: y z
d| 3
ª+ | = ª4 |
ª4 | est la quantité d’information de 1 échantillon de taille , avec
dLnow ; |x
3
ª4 | = : =T U >
d|
Théorème : sous les hypothèses de Cramer-Rao, en particulier si : = Ω est indépendant du paramètre à
estimer |, pour tout estimateur sans biais Z de |, on a :
1
C° Z ≥ = •n |
ª+ |
La quantité •n | est la borne inférieure de Fréchet-Darmois-Cramer-Rao (FDCR en abrégé).
Note : un estimateur sans biais Z est dit efficace si sa variance est égale à la borne inférieure de FDCR :
1
C° Z = = •n |
ª+ |
Ou, un estimateur sans biais Z est dit asymptotiquement efficace si :
C° Z
lim = 1 PQ lim ª+ | C° Z = 1
+→˜ •n | +→˜
→ $ ¥; 2 . Déterminer ª+ ¥
Exemple :
1 1 −¥ 3
On considère
o = l §− £ ¤ ¨
&
2√2¦ 2 2
+
žw ; |x = Ÿ o &; |
&94
1 +
1
žw ; |x = A B l §− 8 & − ¥ 3¨
2√2¦ 22 3
1
Lnžw ; |x = − Ln 2¦2 3 − 38 & −¥ 3
2 22
+
dLnžw ; |x 1
= 38 −¥
d¥ 2 &
&94
29
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
d3 Lnžw ; |x
= − 3 ⟹ ª+ ¥ = −: £− 3 ¤ ⟹ ª+ ¥ = 3
d¥3 2 2 2
De plus, C D ̅ = ³ = , donc ̅ est un estimateur efficace de ¥ pour la loi normale.
4 _a
« ´ +
─ la précision d’un estimateur Z dépend de sa variance, c’est-à-dire de la loi de Z qui dépend elle-même
La recherche du meilleur estimateur d’un paramètre est un problème difficile à résoudre. En effet :
problème, on peut parfois appliquer plusieurs méthodes d'estimation. À chaque méthode d'estimation
correspond un estimateur particulier. Si l'on se restreint aux seules méthodes d'estimation paramétriques, il
existe de nombreuses méthodes suivant le problème étudié et les hypothèses retenues.
Citons par exemple :
─ la méthode des moindres carrés ordinaires ;
─ la méthode des moindres carrés généralisés ;
─ la méthode du maximum de vraisemblance ;
─ la méthode des moments généralisés;
─ la méthode des variables instrumentales;
─ la méthode des doubles moindres carrés ordinaires.
30
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Un intervalle de confiance sur le paramètre | pour un niveau de confiance de 1 − µ (ou un niveau de risque
µ), avec µ ∈ <0, 1;est un encadrement du type :
·≤| ≤• =1−µ
où · R • sont des variables aléatoires, fonctions des variables de l'échantillon 4, ⋯ , + .
ª‘4Hh = ; ; <
Une réalisation de cet intervalle de confiance est notée :
Ainsi, on cherche à encadrer la valeur de | (inconnue) par deux variables aléatoires · R •, telles que la
probabilité que la valeur de | soit comprise entre ces deux variables soit précisément égale à 1 − µ. Ces
variables sont des fonctions des variables de l'échantillon. Dès lors, à partir de la réalisation 4 , ⋯ , + de
l'échantillon, on peut déduire des réalisations des variables · R •, et une réalisation de l'intervalle, c'est-à-dire
deux valeurs encadrant la vraie valeur | pour un niveau de confiance de1 − µ.
Par exemple, si pour un échantillon 4 , ⋯ , + et µ = 5 %, on obtient ª‘ .rq = ;1.2; 1.5<, cela signifie que
pour cette réalisation de l'échantillon (c'est-à-dire pour ces données), il y a 95 % de chances que la valeur de |
soit comprise entre 1,2 et 1,5.
Deux cas sont à distinguer, selon que l’écart-type est connu ou estimé.
31
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅ "
X de l’échantillon, un intervalle de probabilité. On a vu avec l’échantillonnage que :
O ⟶ $ 0, 1
2 ⁄√
Avec Sh⁄3 qui représente la valeur issue de la loi normale centrée et réduite telle que la
probabilité de la queue supérieure est de µ ⁄2.
L’intervalle de probabilité est déterminé comme suit :
w Sh⁄3 O Sh⁄3 x 1 µ
̅ "
T Sh⁄3 Sh⁄3 U 1 µ
2 ⁄√
La valeur Sh⁄3 est lue sur la table de la loi normale centrée et réduite.
On en déduit l’intervalle de confiance pour la moyenne µ :
2 2
A ̅ Sh⁄3 " ̅ 1 Sh⁄3 B 1 µ
√ √
Où x est la moyenne arithmétique de l’échantillon.
2
ª‘ ̅ º Sh⁄3 ⇔ ̅ º Sh⁄3 2E̅
√
Exemple :
Supposons que les heures d’achat des clients d’un centre commercial local soient normalement distribuées
avec un écart type connu de la population de 20 minutes. Un échantillon aléatoire de 64 acheteurs de
32
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Solution
2 20
L’intervalle de confiance est donné par :
ª‘ = ̅ º Sh⁄3 = 75 º 1.96
√ √64
ª‘ .rq ;70.1; 79.9<
population inconnue s'étend d'environ 70 minutes à environ 80 minutes. L’intervalle ;70.1; 79.9< a une
Sur la base d'un échantillon de 64 observations, un intervalle de confiance de 95% pour la moyenne de
probabilité égale à 0.95 de contenir la vraie valeur de la durée d’achat d’un client dans ce centre commercial.
Le niveau de confiance de l'intervalle implique qu'à long terme, 95% des intervalles ainsi trouvés contiennent la valeur vraie de la
µ
Niveau de confiance 90% 95% 98% 99%
Sh⁄3
0,1 0,05 0,02 0,01
1,645 1,96 2,33 2,58
̅ "
X de l’échantillon, un intervalle de probabilité. On a vu avec l’échantillonnage que :
⟶ $ 0, 1
O
2 ⁄√
Mais lorsque la variance est inconnue, elle est estimée à partir de l’échantillon. Comme on l’a vu
dans le chapitre sur l’échantillonnage, on estime cette variance en utilisant un estimateur sans
biais de la variance c'est-à-dire :
+
1
[ 3
8 ̅ 3
2Á 3
1 &
&94
̅ "
Ainsi donc
⟶[ Z 1
[⁄√
Avec Rh⁄3 qui représente la valeur issue de la loi de Student telle que la probabilité de la queue
supérieure est de µ ⁄2.
L’intervalle de probabilité est déterminé comme suit :
w Rh⁄3 O Rh⁄3 x 1 µ
33
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅−"
T−Rh⁄3 < < Rh⁄3 U = 1 µ
[ ⁄√
Le seuil α étant donné, on lit sur la table de Student le nombre Rh⁄3 1 tel que :
[ [
A ̅ Rh⁄3 1 " ̅ 1 Rh⁄3 1 B 1 µ
√ √
[
ª‘ ̅ º Rh⁄3 1
√
Exemple :
On suppose que la loi suivie par la variable aléatoire « salaire hebdomadaire » est une loi
normale de moyenne µ et d’écart-type σ inconnus.
─ Estimation ponctuelle de la moyenne, la moyenne arithmétique : 239.2
[ 3 858.2 29.3 3
─ Estimation ponctuelle de la variance (estimateur non biaisé) :
[
calculs en tenant compte des résultats donnés par l’échantillon :
ª‘ ̅ º Rh⁄3 1
√
29.3 29.3
ª‘ ̅ºR 4 → ª‘ 239.2 º R 4
√5 √5
.rr . q .rr . q
34
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Exercice: Pour estimer le taux d'intérêt moyen sur les prêts à 5 ans consentis par les banques pour l'achat de
voitures neuves, on analyse les comptes de 64 banques pris au hasard, où l'on trouve un taux moyen de
11.65% avec un écart type de 1.20%.
1. Déterminer un intervalle de confiance au seuil de 5% pour le taux d'intérêt moyen
2. Peut-on considérer que ce taux d'intérêt est de 12% au seuil de 5%?
&94
+Ã Äa
_a
La variable aléatoire suit une loi du Chi-deux à n degrés de liberté. Un intervalle de
probabilité pour la variable aléatoire χ 2 ( n ) est (les bornes de l’intervalle sont lues sur la table
de la loi du Chi-deux).
Exemple :
Soit X une variable aléatoire suivant la loi normale N ( 40;σ ) . Pour estimer la variance, on
= ∑+&9 − ̅
+H4 Ã a 4 3
La statistique
_a _a & est une variable de Chi-deux à ( n − 1) degrés de liberté.
La démarche est la même que dans le cas 1.
− 1 b3 − 1 b3
─ pour la variance ( s 2 étant la valeur de la statistique S 2 donnée par l’échantillon) :
≤ 2 3
≤
ph3⁄3 p 34Hh⁄3
… → Ç £È,
Cas 1 : Æ suit une loi inconnue, V est grand V ≥ WX Aƒ ¤B
É
√V
Si la taille de l’échantillon est grande, en pratique n > 30 , grâce au théorème central limite, on
utilise les résultats précédents pour calculer l’intervalle de confiance pour la moyenne. Si la
série prélevée est faible, il faut utiliser les lois suivies par les paramètres étudiés.
Si 2 est connu, on est ramené au premier cas (c'est-à-dire la loi normale)
Si 2 n'est pas connu, on approche la loi de Student par loi Normale
─
─
36
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Exemple :
On considère un échantillon de 40 paquets de biscuits provenant d’une production de 2 000
unités. Le poids moyen obtenu pour cet échantillon est égal à 336 g et l’écart-type empirique,
c’est-à-dire la quantité s , est égal à 0.86g.
Quelle est l’estimation, par intervalle de confiance, du poids moyen de ces paquets de biscuits,
pour l’ensemble de la fabrication, avec les seuils de confiance 0.90, 0.95 et 0.99 ?
Cette situation est comparable aux cas où on a des échantillons de grandes tailles ( 4 , ≥ 30
indépendantes
3
On considère deux échantillons indépendants de taille n1 pour la variable X 1 et de taille n2 pour la variable
X2 .
La variable aléatoire \ = ̅4 − ̅ 3 suit une loi normale d’espérance µ = µ1 − µ2 et d’écart-type :
243 233
2] = d +
4 3
Cas 1:
Si les écart-types sont connus, alors l'intervalle de confiance est donnée par:
243 233
ª‘ = ̅4 − ̅ 3 º Sh⁄3 d +
4 3
Cas 2:
Les écart-types sont inconnus (avec les grands échantillons), on utilise toujours la loi normale même si les
écart-types devraient être estimés.
b43 b33
ª‘ = ̅4 − ̅ 3 º Sh⁄3 d +
4 3
Cas 3:
Les écart-types sont inconnus mais supposés être égaux, dans ce cas si les populations sont normales, alors on
utilise la loi de Student.
bf3 bf3
ª‘ = ̅4 − ̅3 º R +` g+a H3; h⁄3 d +
4 3
37
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
− 1 b43 1 1 b33
bf3 =
4 3
41 3 2
Cas 4:
Les écart types sont inconnus et supposés inégaux.
b43 b33
ª‘ ̅4 ̅ 3 º R j; h⁄3 d 1
4 3
avec
b43 b33
3
? 1 @
4 3
b43 ⁄ 3 b33 ⁄ 3
4
1 3
4 1 3 1
4.2.4. Intervalle de confiance pour le rapport des variances de deux lois normales
Soient X 1 et X 2 deux variables aléatoires indépendantes suivant les lois normales
N ( µ1 ; σ 1 ) et N ( µ1 ; σ 2 ) .
p43 ⁄
Le résultat suivant est connu:
m → m +` ,+a
4
p43 ⁄ 3
1 b43 1 b33
Il est également connu que:
→ p+3` H4 , R → p+3a H4
4 3
243 233
Et donc
1 b43
4
Ê 1
243 4
b43 233 b43 233
T 3U T 3 U T 3U T 3U → m 1, 1
1 b33 24 b3 b3 24 4 3
3
Ê 1
233 3
Ce résultat permet de déterminer un intervalle de confiance pour le rapport de deux variances ou pour tester
l’égalité de deux variances. On utilise les méthodes exposées dans les paragraphes précédents. On obtient par
exemple :
£m4Hh⁄3 4 1, 3 1 m mh⁄3 4 1, 3 1 ¤ 1 µ
b43 233
Jm4Hh⁄3 1, 1 T 3U T 3U mh⁄3 1, 1 K 1 µ
b3 24
4 3 4 3
38
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
1
La propriété suivante de la loi de Fisher nous conduit aux résultat suivant:
m4Hh⁄3 − 1, −1 =
4 3
mh⁄3 3 − 1, 4 −1
_a
On obtient l'intervalle de confiance autour du ratio _aà comme suit:
b33 1 b33
ª‘ = J × ; × mh⁄3 − 1, −1 K
b43 mh⁄3 3 − 1, 4 −1 b43 4 3
Exemple :
Une firme d’expertises en contrôle de matériaux a demandé à un laboratoire d’effectuer une vérification sur la
résistance à la compression de tubes fabriqués par deux usines U1 et U 2 .
On supposera que la résistance à la compression des tubes provenant de chaque usine peut être considérée
comme la réalisation de variables aléatoires suivant des lois normales.
4 = 16 4 = 14
Usine U1 Usine U2
Nombre de cylindre
Résistance moyenne x1 = 90.60 x2 = 94.40
Variance empirique s12 = 62.80 s22 = 55.70
Déterminer un intervalle de confiance bilatéral, à risque symétriques, pour le rapport σ 12 σ 22 des deux
variances (seuil de confiance 90%).
Peut-on considérer comme vraisemblance au seuil α = 10% , l’hypothèse selon laquelle la variance de la
résistance à la compression des tubes provenant de chaque usine est identique ?
39
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
p (1 − p )
E ( Fn ) = p Var ( Fn ) =
n
Selon les valeurs de n et de p , cette loi admet différentes lois limites qui sont utilisées pour déterminer un
intervalle de confiance. Dans la pratique, on peut :
─ utiliser les tables statistiques qui donnent les limites inférieures et supérieures d’un intervalle
de confiance calculées pour différents seuils et différentes valeurs de n et ,
─ utiliser et justifier l’approximation normale.
Intervalle de confiance d’une proportion calculée avec l’approximation normale:
Si l'échantillon est de grande taille (et si), l'approximation normale est valide, la loi de la variable aléatoire Fn
(fréquence des succès) peut être approchée par la loi normale :
l 1−l
$ Ìl; d Í
p . Si l 1 − l > 5, alors
La table de la loi normale centrée réduite permet de construire un intervalle de confiance pour la probabilité
l 1−l o+ 1 − o+
d ≈d
o+ − l
Ainsi, la statistique à utiliser est donnée par:
O=
^o+ 1 − o+
Un intervalle bilatéral à risques symétriques ( fn est la fréquence observée sur l’échantillon) est donné par :
40
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
o+ − l
⎛−Sh⁄3 < < Sh⁄3 ⎞ = 1 − µ
^o+ 1 − o+
⎝ ⎠
o+ 1 − o+ o+ 1 − o+
Ì−Sh⁄3 d < o+ − l < Sh⁄3 d Í=1−µ
o+ 1 − o+ o+ 1 − o+
Ìo+ − Sh⁄3 d < l < o+ + Sh⁄3 d Í=1−µ
Exemple :
Dans un échantillon pris au hasard de 100 automobilistes, on constate que 25 d’entre eux possèdent une
voiture de cylindrée supérieure à 1 600 cc. Quel est l’intervalle de confiance pour la proportion
d’automobilistes possédant une voiture de cylindrée supérieure à 1 600 cc (intervalle bilatéral, à risques
symétriques, seuil de confiance 95 %) ?
Estimation ponctuelle de p : le nombre d’automobilistes possédant une voiture de cylindrée supérieure à 1
600 cc dans un échantillon de taille n = 100 suit la loi binomiale B (100; p ) .
L’intervalle [ 0.165; 0.335] a 95 chances sur 100 de contenir la vraie valeur de la proportion
o4 1 − o4 o3 1 − o3
ª‘ = o4 − o3 º Sh⁄3 d +
4 3
Exemple
41
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Au cours de l'année électorale, plusieurs sondages ont et faits pour déterminer la perception que les électeurs
ont d'un candidat donné. Dans un échantillon aléatoire de 120 inscrits d'une circonscription , 107 des
circonscription Ô , seulement 73 indiquent supporter le même candidat. Les proportions dans les deux
inscrits indiquent qu'ils supportent le candidat en question. Dans un échantillon de 141 inscrits dans la
2
population est donné par :
̅ º Sh⁄3
√
Sh⁄3 2
On a donc pour marge d’erreur dans la construction de l’intervalle,
Œ:
√
Sh⁄3 2
Si la marge d’erreur est déterminée par avance, on a donc
√
Œ:
Sh⁄3 2 3
Et don peut déterminer en prenant le carrée de l’expression précédente.
Ö ×
Œ:
o+ 1 o+
o+ º Sh⁄3 d
comme o+ 1 o+ ne peut pas dépasser 0.25, sa valeur lorsque la proportion empirique est égale à 0.5. Donc
On ne peut pas utiliser ce résultat pour déterminer directement la taille nécessaire pour l’échantillon. Mais
0.25 0.5Sh⁄3
Œ: Sh⁄3 d
√
0.5Sh⁄3
On obtient dans ce cas,
√
Œ:
0.25wSh⁄3 x
3
On a donc
Œ: 3
42
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
La théorie des tests consiste à formuler des hypothèses particulières sur les paramètres ou sur les lois qui
interviennent dans les problèmes étudiés, puis à apporter un jugement sur ces hypothèses. Ce jugement est
basé d’une part, sur les résultats obtenus sur un ou plusieurs échantillons extraits de la population concernée
et d’autre part, sur l’acceptation d’un certain risque dans la prise de décision.
Exemple introductif :
Considérons des lampes à incandescence dont la durée de vie est une variable aléatoire gaussienne de
moyenne µ = 1000 heures et d’écart-type σ = 100 heures (résultats établis expérimentalement). Un ingénieur
propose un nouveau procédé de fabrication qui doit améliorer, affirme-t-il, cette durée de vie moyenne et la
rendre égale à 1 075 heures. Cependant, le procédé, étant plus onéreux, ne pourra être accepté que si
l’amélioration est réelle.
Le résultat qui doit être vérifié est donc µ > 1000 heures. Deux hypothèses sont en présence :
─ Soit µ = 1000 heures est une hypothèse encore vraie et le nouveau procédé n’a pas modifié de façon
significative la durée de vie des lampes,
─ soit µ = 1075 heures et le nouveau procédé a apporté une réelle amélioration.
La deuxième affirmation est aussi une hypothèse car aucune expérience ne permet d’affirmer que la moyenne
des durées de vie augmentera réellement ( µ > 1000 heures). En effet, il est possible que le nouveau procédé
de fabrication n’améliore pas la durée de vie des ampoules de façon appréciable, il pourrait même la diminuer.
En conclusion, rejeter l’hypothèse µ = 1000 heures ne conduit pas nécessairement à accepter l’hypothèse
µ > 1000 heures.
Les hypothèses ayant été formulées, il faut les accepter ou les rejeter à l’aide des données apportées par un
échantillon. Une incertitude est toujours associée au jugement apporté par le statisticien, mais ce dernier doit
essayer de limiter ce risque.
43
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
En général, si on est amené à rejeter l’hypothèse H0 , c’est-à-dire si on considère que l’hypothèse H1 est vraie,
on devra apporter des corrections à un procédé de fabrication. Mais ces modifications ne peuvent être
envisagées que dans la mesure où les résultats observés sont convaincants, car cette décision repose sur
l’information apportée par un échantillon.
Il faut donc admettre que toute décision prise comporte un certain risque qu’elle soit erronée. Ce risque est
donné par le seuil de signification du test.
On peut, par exemple, accepter un risque α = 0.05 de rejeter l’hypothèse H0 , alors qu’elle est vraie, c’est
donc le risque d’accepter l’hypothèse H1 . Cette conclusion signifie que le résultat obtenu sur un échantillon
n’avait que 5 chances sur 100 de se produire ou, en d’autres termes, les valeurs apportées par l’échantillon et
la valeur µ0 sont considérées comme significativement différentes.
b. Principales définitions
─ Une hypothèse statistique est une affirmation concernant certaines caractéristiques d’une
population telles que la valeur d’un ou de plusieurs paramètres, la forme de la distribution...
─ Un test d’hypothèse ou test statistique est une démarche conduisant à élaborer une règle de décision
permettant de faire un choix entre deux hypothèses statistiques. Les hypothèses envisagées a
priori s’appellent :
L’hypothèse nulle H0 . C’est l’hypothèse selon laquelle on fixe apriori la valeur d’un paramètre. Elle
spécifie une valeur particulière à analyser .
L’hypothèse alternative H1 . On peut choisir pour cette hypothèse n’importe quelle hypothèse
compatible avec le problème étudié, mais différente de H0 . Elle énonce la modification de
l'hypothèse nulle à tester dans l'analyse.
Avant toute démarche statistique, il faut définir à quelle condition l’une ou l’autre des hypothèses sera
considérée comme vraisemblable. Les deux hypothèses ne jouent pas le même rôle. En effet, c’est l’hypothèse
nulle H0 qui est soumise au test et toute démarche statistique consiste à la considérer comme vraie. Si le test
conduit à la rejeter, c’est l’hypothèse alternative H1 qui sera considérée comme vraie.
─ La statistique du test: est la quantité de l'échantillon sur laquelle la décision de rejeter ou non
l'hypothèse nulle est basée.
─ La région ou la zone de rejet: est l'ensemble des valeurs de la statistique du test qui entraine le rejet
de l'hypothèse nulle en faveur de l'hypothèse alternative. Le complémentaire de la région de
44
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
rejet est l'ensemble des valeurs de la statistique du test ne conduisant pas au rejet de
l'hypothèse alternative (région de non rejet).
─ La valeur critique : est la frontière entre la zone de rejet et la zone de non rejet.
Exemple:
Il est connu que les statistiques déduites des grands échantillons suivent la loi normale. Cela permet de
par exemple Ø : | = | pour le paramètre | dont l'estimateur est |} suit une distribution normale de
déterminer facilement la statistique du test pour tester les hypothèses. Comme illustration, on choisit de tester
moyenne | et d'écart type 2°‡ . On suppose que 2°‡ est connu ou on peut obtenir une bonne approximation
lorsque la taille de l'échantillon est grande.
|} − |
La statistique du test est donc:
O=
2°‡
En considérant les différentes hypothèses alternatives avec un risque d'erreur µ, on a:
Pour une hypothèse alternative du type: Ú‚ : † > †X (un test unilatéral à droite) on a:
Pour une hypothèse alternative du type: Ú‚ : † < †X (un test unilatéral à gauche) on a:
45
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Pour une hypothèse alternative du type: Ú‚ : † ≠ †X (un test bilatéral à risque symétrique) on a:
−Sh⁄3 Sh⁄3
µ = ÛD Ü R D Ø |Ø bR D ! Ý
Ce risque α définit la région critique W , d’aire α et de probabilité α , sous l’hypothèse H0 . C’est l’ensemble
des valeurs de la variable aléatoire de décision qui conduisent à écarter H0 au profit de H1 .
La région complémentaire, W , d’aire (1 − α ) et de probabilité (1 − α ) , représente la région d’acceptation de
l’hypothèse H0 .
La règle de décision peut se formuler de la façon suivante :
Si la valeur de la statistique considérée appartient à la région d’acceptation W , on favorise l’hypothèse nulle H0 , si elle
appartient à la région critique W , on favorise l’hypothèse alternative H1 .
La règle de décision comporte un risque β ou risque de deuxième espèce, c’est le risque de ne pas rejeter H0
alors que H1 est vraie :
µ= Û l b D Ü R D Ø |Ø bR o Qbb Ý
( )
Pr W / H 0 = 1 − α Pr (W / H1 ) = 1 − β
46
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
En résumé:
─ Erreur de première espèce : on rejette H0 alors que H0 est vraie.
─ Erreur de deuxième espèce : on ne rejette pas H0 alors que H1 est vraie.
Étape 2. Définir la forme de la région critique : cela revient à définir la statistique de test Z ainsi que
soit le plus élevé.
statistique.
─ Étape 3. À partir des hypothèses faites sur la (ou les) variable(s) d'intérêt et l'échantillon,
dériver la distribution exacte ou la distribution asymptotique de la statistique de test T sous
Étape 4. Déterminer la (ou les) valeur(s) critique(s) en fonction du niveau de risque ½ du test.
l'hypothèse nulle.
niveau de risque ½. Si, au contraire, cette réalisation n'appartient pas à la région critique, on
conclut que l'on ne peut pas rejeter l’hypothèse nulle Ø pour un niveau de risque ½.
Lorsque l’écart-type 2 est connu ou estimé par [. Selon l’hypothèse H1 , différents cas sont à étudier :
La statistique du test (lorsque Ø vraie) est donnée par:
̅−"
O= → $ 0, 1
2 ⁄√
ÚX : Þ = ÞX ß¼ ÚX : Þ ≤ ÞX ¾• Ú‚ : Þ > ÞX
47
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅−"
En désignant par α le risque de première espèce, la région critique est définie par :
O > Sh = µ ≡ T > Sh U = µ
2⁄√
Décision: l'hypothèse nulle est rejetée si
̅−"
> Sh PQ ̅ " 1 Sh 2⁄√
2 ⁄√
̅ "
Ou encore lorsque
O.*-.,-é O-, Sh
2 ⁄√
ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX
La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas précédent. En
̅ "
désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
2⁄√
Décision: l'hypothèse nulle est rejetée si
̅ "
Sh PQ ̅ " Sh 2⁄√
2⁄√
̅ "
Ou encore lorsque
O.*-.,-é O-, Sh
2⁄√
ÚX : Þ ÞX ¾• Ú‚ : Þ i ÞX
La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas précédent. En
̅ "
désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Sh⁄3 O Sh⁄3 x µ ≡ T Sh⁄3 Sh⁄3 U µ
2⁄√
Décision: l'hypothèse nulle est rejetée si
̅ "
Ou encore lorsque
|O.*-.,-é | á á O-, Sh⁄3
2⁄√
Dans ce cas, l’écart-type 2 est estimé par [. Selon l’hypothèse H1 , différents cas sont à étudier :
48
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅−"
Z= → [RQâ R 1
b ⁄√
ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX
̅ "
En désignant par α le risque de première espèce, la région critique est définie par :
wZ R +H4 ,h x µ ≡ T R +H4 ,h U µ
b ⁄√
Décision: l'hypothèse nulle est rejetée si
̅ "
R +H4 ,h PQ ̅ " 1 R +H4 ,h b⁄√
b⁄√
̅ "
Ou encore lorsque
Z.*-.,-é R-, R +H4 ,h
b⁄√
ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX
La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas
̅ "
précédent. En désignant par α le risque de première espèce, la région critique est définie par :
wZ R +H4 ,h x µ ≡ T R +H4 ,h U µ
b ⁄√
Décision: l'hypothèse nulle est rejetée si
̅ "
R +H4 ,h PQ ̅ " R +H4 ,h b⁄√
b ⁄√
̅ "
Ou encore lorsque
Z.*-.,-é R-, R +H4 ,h
b ⁄√
ÚX : Þ ÞX ¾• Ú‚ : Þ i ÞX
La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas
précédent. En désignant par α le risque de première espèce symétrique, la région critique est
̅ "
définie par :
w R +H4 ,h⁄3 Z R +H4 ,h⁄3 x µ ≡ T R +H4 ,h⁄3 R +H4 ,h⁄3 U µ
b ⁄√
49
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅ < " − R +H4 ,h⁄3 b⁄√ PQ ̅ > " + R +H4 ,h⁄3 b⁄√
De manière équivalente, on a:
̅−"
Ou encore lorsque
|Z.*-.,-é | = á á > R-, = R +H4 ,h⁄3
b ⁄√
Exemple :
On prélève au hasard, dans une population suivant une loi normale de variance égale à 25, un échantillon de
taille n = 16 . En choisissant un risque de première espèce α = 0.05 (risque bilatéral, symétrique) quelle est la
règle de décision si l’on veut tester les hypothèses :
H 0 : µ = µ0 = 45 et H1 : µ = µ1 ≠ 45 ?
Exemple :
Un fabricant de téléviseurs achète un certain composant électronique à un fournisseur. Un accord entre le
fournisseur et le fabricant stipule que la durée de vie de ces composants doit être égale à 600 heures au moins.
Le fabricant qui vient de recevoir un lot important de ce composant veut en vérifier la qualité. Il tire au
hasard un échantillon de 16 pièces. Le test de durée de vie pour cet échantillon donne les résultats suivants.
Le fabricant doit-il accepter le lot ? (On choisit un risque de première espèce égal à 5%.) Quel est le risque de
deuxième espèce ? On admettra que la durée de vie de ces composants suit une loi normale.
Exemple
hebdomadaire de réparation est " = 1200$ . Pour savoir si cette déclaration est vérifiée, les coûts de
Une société fixe son budget annuel pour une nouvelle usine en faisant l'hypothèse que le coût moyen
donne ̅ = 1290$ et un écart type de 110$. Est-ce que l'échantillon indique que 1200$ n'est pas bien fixé
réparation de 10 semaines sont obtenus pour des usines similaires. L'échantillon est supposé aléatoire et
On donne µ = 0.05
pour le coût moyen hebdomadaire de réparation? On suppose que le coût moyen est normalement distribué.
concernant la valeur de la variance de la population 2 3 . Pour ce faire, on utilise la statistique utilisée lors de la
Généralement, la variance de la population est inconnue. Souvent il est souhaitable de faire un test
[ €3
3 →p+
3
2
Ø : 2 3 = 2 3 PQ Ø : 2 3 ≤ 2 3 b Ø4 : 2 3 > 2 3
En désignant par α le risque de première espèce, la région critique est définie par :
wp 3+ > p 3+ ,h x = µ
50
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
[ €3
Décision: On rejette l'hypothèse nulle si
> p 3+
23
[ €3
ou si
p.*-.,-é
3
p-,
3
p 3+
23 ,h
Ø : 2 3 2 3 PQ Ø : 2 3 2 3 b Ø4 : 2 3 2 3
En désignant par α le risque de première espèce, la région critique est définie par :
wp 3+ p 3+ ,4Hh x 1 µ
[ €3
Décision: On rejette l'hypothèse nulle si
p 34Hh
23 ,+
[ €3
ou si
p.*-.,-é
3
p-,
3
p 3+
23 ,4Hh
Ø : 23 23 b Ø4 : 2 3 i 2 3
En désignant par α le risque de première espèce symétrique , la région critique est définie par :
wp 3+ ,4Hh⁄3 p 3+ p 3+ ,h⁄3 x µ
[ €3 [ €3
Décision: On rejette l'hypothèse nulle si
p 3
PQ p 3+ ,4Hh⁄3
23 + ,h⁄3
23
Si la moyenne µ est inconnue la statistique (sous l'hypothèse Ø ) du test est:
1 [3
→ p 3+H4
23
Ø : 23 2 3 PQ Ø : 2 3 23 b Ø4 : 2 3 23
En désignant par α le risque de première espèce, la région critique est définie par :
wp 3+H4 p 3+H4 ,h x µ
1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,h
23
1 [3
ou si
p.*-.,-é
3
p-,
3
p 3+H4 ,h
23
51
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Ø : 23 2 3 PQ Ø : 2 3 23 b Ø4 : 2 3 23
En désignant par α le risque de première espèce, la région critique est définie par :
1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,4Hh
23
1 [3
ou si
p.*-.,-é
3
p-,
3
p 3+H4 ,4Hh
2 3
Ø : 23 23 b Ø4 : 2 3 i 2 3
En désignant par α le risque de première espèce symétrique , la région critique est définie par :
1 [3 1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,h⁄3 PQ p 3+H4 ,4Hh⁄3
23 23
Exemple
Une machine produit des pièces de machine. Le producteur déclare que la variance du diamètre ne peut pas
p (1 − p )
N p;
o+ l
n
O → $ 0, 1
•l 1 l ⁄
Sous l'hypothèse Ø : l l , la statistique du test est donnée par:
52
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
o+ − l
O= → $ 0, 1
•l 1 l ⁄
ÚX : ä äX ß¼ ÚX : ä äX ¾• Ú‚ : ä äX
o+ l
En désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
•l 1 l ⁄
Décision: l'hypothèse nulle est rejetée si
o+ l
Sh PQ o+ l 1 Sh •l 1 l ⁄
•l 1 l ⁄
o+ l
Ou encore lorsque
O.*-.,-é O-, Sh
•l 1 l ⁄
ÚX : ä äX ß¼ ÚX : ä äX ¾• Ú‚ : ä äX
o+ l
En désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
•l 1 l ⁄
o+ l
Sh PQ o+ l Sh •l 1 l ⁄
•l 1 l ⁄
o+ l
Ou encore lorsque
O.*-.,-é O-, Sh
•l 1 l ⁄
ÚX : ä äX ¾• Ú‚ : ä i äX
o+ l
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Sh⁄3 O Sh⁄3 x µ ≡ T Sh⁄3 Sh⁄3 U µ
•l 1 l ⁄
Décision: l'hypothèse nulle est rejetée si
o+ l o+ l o+ l
á á Sh⁄3 ≡ Sh⁄3 PQ Sh⁄3
•l 1 l ⁄ •l 1 l ⁄ •l 1 l ⁄
o+ l Sh⁄3 •l 1 l ⁄ PQ o+ l 1 Sh⁄3 •l 1 l ⁄
De manière équivalente, on a:
Ou encore lorsque
53
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
o+ l
|O.*-.,-é | á á O-, Sh⁄3
•l 1 l ⁄
Exemple
Une machine dans une usine doit être réparée si elle produit plus de 10% de pièce défectueuse dans un grand
lot de production journalière. Un échantillon aléatoire de 100 pièces sont choisit sur une production
l'échantillon fournit des éléments pour supporter cette décision à un niveau de signification de µ 0.01?
journalière et contient 15 pièces défectueuses et on propose que la machine devra être réparé. Est-ce que
d. Tests d'hypothèses pour le cas des échantillons multiples (02 échantillons) : tests
paramétriques de comparaison d’échantillons
première population a pour moyenne "4 et de variance 243 de laquelle est tiré un échantillon de taille 4 qui
On considère le cas où on a deux échantillons aléatoire indépendants issus de deux populations normales. La
fourni une moyenne empirique ̅4 . La deuxième population a pour moyenne "3 et de variance 233 de laquelle
est tiré un échantillon de taille 3 donne une moyenne empirique de ̅3 . Le test de comparaison est destiné à
déterminer, à partir de ̅4 et ̅ 3, s’il existe une différence entre les deux moyennes inconnues "4 et "3 .
Dans le chapitre sur la distribution d'échantillonnage, il a été montré que la variable aléatoire \ ̅4 ̅3
suit une loi normale d’espérance µ = µ1 − µ2 et d’écart-type :
23 23
2] d 4 1 3
4 3
̅4 ̅3 "4 "3
on a donc
O → $ 0, 1
23 233
d 4 1
4 3
̅4 ̅3 \
O
243 233
d 1
4 3
Les tests suivantes peuvent être menés en fonction des hypothèses alternatives.
En désignant par α le risque de première espèce, la région critique est définie par :
54
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
⎛ ⎞
̅ − ̅3 − \
O > Sh = µ ≡ ⎜ 4 > Sh ⎟ = µ
⎜ ⎟
243 233
d +
⎝ 4 3 ⎠
̅4 − ̅ 3 − \ 243 233
> Sh PQ ̅4 − ̅ 3 > \ + Sh d +
23 233
4 3
d 4 +
4 3
̅4 − ̅ 3 − \
Ou encore lorsque
O.*-.,-é = > O-, = Sh
23 233
d 4 +
4 3
En désignant par α le risque de première espèce, la région critique est définie par :
⎛ ⎞
̅ − ̅3 − \
O < −Sh = µ ≡ ⎜ 4 < −Sh ⎟ = µ
⎜ ⎟
23 23
d 4 + 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
̅4 − ̅ 3 − \ 243 233
< −Sh PQ ̅4 − ̅ 3 < \ − Sh d +
243 233
4 3
d +
4 3
̅4 − ̅ 3 − \
Ou encore lorsque
O.*-.,-é = < −O-, = −Sh
23 233
d 4 +
4 3
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
55
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
⎛ ⎞
̅4 − ̅ 3 − \
w−Sh⁄3 < O < Sh⁄3 x = µ ≡ ⎜−Sh⁄3 < < Sh⁄3 ⎟ = µ
⎜ ⎟
23 23
d 4 + 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
ç ̅ − ̅ −\ ç ̅4 − ̅ 3 − \ ̅4 − ̅ 3 − \
> Sh⁄3 ≡ < −Sh⁄3 PQ > Sh⁄3
4 3
De manière équivalente, on a:
243 233 243 233
̅4 − ̅3 < \ − Sh⁄3 d + PQ ̅4 − ̅3 > \ + Sh⁄3 d +
4 3 4 3
Ou encore lorsque
ç ̅ − ̅ −\ ç
|O.*-.,-é | = > O-, = Sh⁄3
4 3
ç 243 233 ç
d +
4 3
Note: Les précédents tests sont menés sur de grands échantillons issus des populations normales, ou de grands échantillons issus
de populations de lois quelconques mais pouvant se ramener à une loi normale à travers le théorème central limite. Ces différentes
formules s'appliquent lorsque les variances des populations sont connues, si elles ne sont pas connues, les mêmes formules sont
appliquées en remplaçant juste la variance par sa valeur estimée.
Exemple :
On suppose que les diamètres sont distribués suivant une loi normale et que les écarts-types sont égaux à :
σ A = 1mm et σ B = 0.45mm .
Peut-on affirmer au niveau 5% qu’il y a une différence significative entre les procédés de fabrication A et B ?
Exemple
Une étude est menée pour comparer la durée que prenne un homme et une femme dans certaines tâches
d'assemblage. Des échantillons de 50 hommes et 50 femmes sont utilisés dans une expérience dans laquelle
56
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
chaque personne est chronométrée en secondes sur des tâches identiques. Les résultats sont résumés dans le
tableau suivant:
Hommes Femmes
̅
50 50
b 3
42 38
18 14
Est-ce que les données des échantillons apportent de preuves suffisantes pour affirmer qu'il y a différence
entre la durée d'exécution des tâches entre les hommes et les femmes ?
première population a pour moyenne "4 de laquelle est tiré un échantillon de taille 4 qui fourni une
On considère le cas où on a deux échantillons aléatoires indépendants issus de deux populations normales. La
moyenne empirique ̅4 et variance empirique b43 . La deuxième population a pour moyenne "3 de laquelle est
tiré un échantillon de taille 3 donne une moyenne empirique de ̅3 et de variance empirique b33 . Le test de
comparaison est destiné à déterminer, à partir de ̅4 et ̅3 , s’il existe une différence entre les deux moyennes
inconnues "4 et "3 .
Dans ce cas, on détermine bf3 qui est l'écart types empirique des deux échantillons mis ensemble. C'est une
Cas 1: les variances sont inconnues mais supposées égales
41 3 2 41 3 2
Il a été montré que la variable aléatoire \ ̅4 ̅ 3 dans le cas présent suit une de Student à
41 3 2 degré de liberté.
La statistique du test sous l'hypothèse Ø : "4 "3 \ est donnée par:
̅4 ̅3 \
Z
1 1
bf ^ 1
4 3
Les tests suivantes peuvent être menés en fonction des hypothèses alternatives.
En désignant par α le risque de première espèce, la région critique est définie par :
̅4 ̅3 \
Z Rh µ≡ ⎛ Rh ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
57
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
̅4 − ̅ 3 − \ 1 1
Rh PQ ̅4 ̅3 \ 1 Rh bf d 1
1 1
bf ^ 1
4 3
4 3
̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
1 1
bf ^ 1
4 3
En désignant par α le risque de première espèce, la région critique est définie par :
̅4 ̅3 \
Z Rh µ≡ ⎛ Rh ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
̅4 ̅3 \ 1 1
Rh PQ ̅4 ̅3 \ Rh bf d 1
1 1
bf ^ 1
4 3
4 3
̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
1 1
bf ^ 1
4 3
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
̅4 ̅3 \
w Rh⁄3 Z Rh⁄3 x µ≡ ⎛ Rh⁄3 Rh⁄3 ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠
̅4 ̅3 \ ̅4 ̅3 \ ̅4 ̅3 \
çç çç Rh⁄3 ≡ Rh⁄3 PQ Rh⁄3
1 1 1 1 1 1
bf ^ 1 bf ^ 1 bf ^ 1
4 3 4 3 4 3
1 1 1 1
De manière équivalente, on a:
̅4 ̅3 \ Rh⁄3 bf d 1 PQ ̅4 ̅3 \ 1 Rh⁄3 bf d 1
4 3 4 3
58
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Ou encore lorsque
̅4 ̅3 \
|Z.*-.,-é | çç çç Z-, Rh⁄3
1 1
bf ^ 1
4 3
Il a été montré que la variable aléatoire \ ̅4 ̅ 3 dans le cas présent suit une de Student à
Dans ce cas les l'écart types empiriques des deux échantillons sont utilisés mais degré de liberté change.
degré de
liberté.
b43 b33
3
? 1 @
4 3
b43 ⁄ 3 b33 ⁄ 3
4
1 3
4 1 3 1
̅4 ̅3 \
Z
b43 b33
d 1
4 3
Les tests suivants peuvent être menés en fonction des hypothèses alternatives.
En désignant par α le risque de première espèce, la région critique est définie par :
⎛ ⎞
̅ ̅3 \
Z Rh µ≡ ⎜ 4 Rh ⎟ µ
⎜ ⎟
b3 b3
d 41 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
̅4 ̅3 \ b43 b33
Rh PQ ̅4 ̅3 \ 1 Rh d 1
b43 b33
4 3
d 1
4 3
̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
b43 b33
d 1
4 3
59
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
En désignant par α le risque de première espèce, la région critique est définie par :
⎛ ⎞
̅ − ̅3 − \
Z < −Rh =µ≡ ⎜ 4 < −Rh ⎟=µ
⎜ ⎟
b 3
b 3
d 4+ 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
̅4 − ̅ 3 − \ b43 b33
< −Rh PQ ̅4 − ̅ 3 < \ − Rh d +
b43 b33
4 3
d +
4 3
̅4 − ̅ 3 − \
Ou encore lorsque
Z.*-.,-é = < −Z-, = −Rh
b3 b33
d 4 +
4 3
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
⎛ ⎞
̅4 − ̅ 3 − \
w−Rh⁄3 < Z < Rh⁄3 x=µ≡ ⎜−Rh⁄3 < < Rh⁄3 ⎟=µ
⎜ ⎟
b3 b33
d 4 +
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si
ç ̅ − ̅ −\ ç ̅4 − ̅ 3 − \ ̅4 − ̅ 3 − \
> Rh⁄3 ≡ < −Rh⁄3 PQ > Rh⁄3
4 3
De manière équivalente, on a:
b43 b33 b43 b33
̅4 − ̅ 3 < \ − Rh⁄3 d + PQ ̅4 − ̅3 > \ + Rh⁄3 d +
4 3 4 3
Ou encore lorsque
60
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
ç ̅ − ̅ −\ ç
|Z.*-.,-é | = > Z-, = Rh⁄3
4 3
ç b3 b33 ç
d 4 +
4 3
Exemple
Le concepteur d'une nouvelle machine de découpage de tôle déclare que sa nouvelle machine peut découper
plus vite celle actuellement utilisée. Un échantillon de 9 tôles de même caractéristiques est découpé par
chaque type de machine. La durée de découpage est en secondes.
̅
9 9
b 3
35.22 31.56
24.44 20.03
Au risque de première espèce de 5%, est ce que la déclaration du concepteur est vérifiée? on suppose une
distribution normale pour le temps de découpage.
Les deux tests précédents marchent seulement dans le cas où les échantillons peuvent avoir de dépendance.
C'est souvent le cas lorsque des observations sont répétées sur la même unité d’échantillon tel que compter le
nombre d'accident dans des usines avant et après l'institution d'un programme de sécurité. Si on considère 2
usines différentes, le comptage est indépendant, mais dans une même usine, avant et après, le programme, le
Soit 4 , Ô4 , ⋯ , + , Ô+ désignant un échantillon de couples d'observation c'est-à-dire & , Ô& désigne deux
comptage devient dépendant.
\… = 8 \& R [] =
3 …
8 \& − \ 3
−1
&94 &94
En désignant par α le risque de première espèce, la région critique est définie par :
61
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
… − "è
\
Z > Rh =µ≡ T > Rh U=µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si
… − "è
\
> Rh …
PQ \ "è 1 Rh b] ⁄√
b] ⁄√
…
\ "è
Ou encore lorsque
Z.*-.,-é Z-, Rh
b] ⁄√
… "è
\
En désignant par α le risque de première espèce, la région critique est définie par :
Z Rh µ≡ T Rh U µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si
…
\ "è
Rh …
PQ \ "è Rh b] ⁄√
b] ⁄√
…
\ "è
Ou encore lorsque
Z.*-.,-é Z-, Rh
b] ⁄√
\… "è
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Rh⁄3 Z Rh⁄3 x µ ≡ T Rh⁄3 Rh⁄3 U µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si
…
\ "è …
\ "è …
\ "è
á á Rh⁄3 ≡ Rh⁄3 PQ Rh⁄3
b] ⁄√ b] ⁄√ b] ⁄√
… "è
\ Rh⁄3 b] ⁄√ PQ …
\ "è 1 Rh⁄3 b] ⁄√
De manière équivalente, on a:
…
\ "è
Ou encore lorsque
|Z.*-.,-é | á á Z-, Rh⁄3
b] ⁄√
Pour faire un tel test, on introduit la distribution de probabilité de Fisher m . On considère b43 la variance
empirique d'un échantillon aléatoire de taille 4 issu d'une population normale de variance 243 . Un deuxième
échantillon de taille 3 , de variance empirique b33 issu d'une population normale de variance 233 . Il a été
− 1 b43
montré que la variable aléatoire
4
Ê 1
243 4
b43 233 b43 233
T 3U T 3 U T 3U T 3U → m 1, 1
1 b33 24 b3 b3 24
4 3
3
Ê 1
233 3
La statistique du test sous l'hypothèse nulle Ø : 243 233 est donnée par:
b43
m → m 4 1, 1
b33 3
b43
On rejette l'hypothèse nulle si:
m mh 1, 1
b33 4 3
b43
ou
mé*-.,-é m-, mh 1, 1
b33 4 3
b43
On rejette l'hypothèse nulle si:
m m4Hh 1, 1
b33
4 3
b43
ou si
b43 b43
On rejette l'hypothèse nulle si:
m mh⁄3 1, 1 PQ m m4Hh⁄3 1, 1
b33 4 3
b33 4 3
Exemple
Une machine produit des pièces de machine. Sur un échantillon de 10 pièces produites par cette machine, on
obtient une variance d'échantillon de 0.0003. On souhaite comparer cette variance avec celle d'un de ses
concurrents. On choisit alors un échantillon de 20 pièces de sa production qui fournit une variance empirique
63
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
Dans cette section, on développe la procédure pour comparer deux proportions de population statistiques.
Pour se faire, on considère le modèle standard où on choisit un échantillon de taille 4 de la population 1 qui
fournit une proportion l4 et 3 de la population 2 de proportion l3 .
Dans le chapitre de la théorie de l'échantillonnage, on a montré que si o4 désigne la proportion empirique de
l'échantillon issu de la population 1 et o3 la proportion empirique de la population 2, alors
o4 − o3 − l4 − l3
O= → $ 0, 1
l4 1 l4 l3 1 l3
^
4 3
o4 o3
O → $ 0, 1
l 1 l l 1 l
^
4 3
Avec l qui est inconnu peut être estimé par
4 l̂ 1 3 l̂
l̂
41 3
Les hypothèses suivantes peuvent être testées:
Ø : l4 l3 0 PQ Ø : l4 l3 0 b Ø4 : l4 l3 0
o4 o3
Décision: on accepte l'hypothèse nulle si
Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3
o4 o3
ou
Oé*-.,-é O-, Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3
Ø : l4 l3 0 PQ Ø : l4 l3 0 b Ø4 : l4 l3 0
o4 o3
Décision: on accepte l'hypothèse nulle si
Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3
o4 o3
ou
Oé*-.,-é O-, Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3
Ø : l4 l3 0 b Ø : l4 l3 i 0
o4 − o3
−Sh⁄3 < < Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂
^ −
4 3
ou
o4 − o3
çç çç > Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂
^ −
4 3
o4 − o3 o4 − o3
ou encore
< −Sh⁄3 PQ > Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂ l̂ 1 − l̂ l̂ 1 − l̂
^ − ^ −
4 3 4 3
Exemple :
La gendarmerie nationale procède au contrôle des charges transportées par les camions. Sur 473 camions
contrôlés au mois de Janvier, 105 s’avèrent être en surcharge. 128 des 500 camions contrôlés en février
présentent une charge supérieure à celle autorisée.
Peut on conclure que la proportion des camions en surcharge en février est supérieure à celle de Janvier ?
65
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
66
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
67
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
wpt3 pt,h
3
x µ
68
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020
69
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Table 4.1a. Table de Fisher ½ = X. ‚X
70
Table 4.1b. Table de Fisher ½ = X. ‚X
71
Table 4.2a. Table de Fisher ½ = X. Xì
72
Table 4.2b. Table de Fisher ½ = X. Xì
73
Table 4.3a. Table de Fisher ½ = X. X•ì
74
Table 4.3b. Table de Fisher ½ = X. X•ì
75
Table 4.4a. Table de Fisher ½ = X. X‚
76
Table 4.4a. Table de Fisher ½ = X. X‚
77