Syllabus Math Stat 2

Chapitre V
Échantillonnage – Distribution
d’échantillonnage
1. Introduction
La statistique inférentielle repose sur une idée simple : il existe un ensemble d’individus
appelé population dont les caractéristiques ne sont pas connues.
À partir de l’observation d’un sous-ensemble d’individus de cette population, l’échan-

tillon, on va chercher à déterminer, à induire, les principales caractéristiques de la popu-
lation.
La statistique inférentielle élabore des méthodes qui permettent de porter un juge-

ment, de décider à propos de la population, au vu des résultats obtenus pour l’échantillon,
en utilisant entre autres le calcul des probabilités.
Exemples : l’inférence peut être illustrée à partir de l’exemple de l’échantillon de 158

ménages du quartier A . Voici les trois types de questions abordées :
1. Estimation ponctuelle
On connaı̂t le revenu moyen de l’échantillon des 158 ménages du quartier A
( x = 7348 € ).
§ V. Échantillonnage – Distribution d’échantillonnage
Peut-on inférer une estimation du revenu moyen, que nous noterons µ , de l’ensemble
de tous les ménages du quartier A?
Il s’agit d’une estimation ponctuelle :
- estimation car il faut proposer une valeur pour le paramètre µ ;
- ponctuelle car il ne faut proposer qu’une seule valeur pour µ .
2. Estimation par intervalle de confiance

Il est quasiment impossible que l’estimation x (moyenne de l’échantillon) proposée
pour µ (moyenne de la population) coı̈ncide exactement avec la vraie valeur in-
connue de µ . La vraie valeur µ est la moyenne des revenus qui serait obtenue en
réalisant, lorsque c’est possible, un recensement. Le calcul des probabilités va per-
mettre de déterminer un intervalle, centré en la moyenne de l’échantillon x , dans
lequel la vraie valeur µ va vraisemblablement se situer.
Il s’agit alors d’une estimation par intervalle de confiance.
3. Test d’hypothèses
Une hypothèse est formulée en fonction de la connaissance générale du phénomène
étudié. Par exemple, d’après une enquête, le revenu moyen des ménages de l’agglo-
mération à laquelle appartient le quartier A est de 8000 € par mois. On peut se
demander si le revenu moyen dans le quartier A est supérieur à 8000 € (première
hypothèse) ou au contraire s’il est inférieur à 8000 € (deuxième hypothèse). Le choix
entre ces deux hypothèses se fera sur la base d’un échantillon dans le quartier A .
Dans notre échantillon dans le quartier A , x = 7348 € . L’écart entre cette valeur et
la valeur 8000 € , proposée par la première hypothèse, est-il le reflet d’une véritable
différence de revenus, ou n’est-il que la conséquence des aléas liés à l’utilisation d’un
échantillon pour décider?
Estimation ponctuelle, estimation par intervalle de confiance et tests d’hypothèses

constituent les bases de la statistique inférentielle.
Ces questions — estimation, précision de l’estimation, . . . — se posent parce que seule
une partie de la population, l’échantillon, est connue.
Si l’ensemble de tous les ménages du quartier A était étudié (recensement), les questions
précédentes n’auraient plus d’intérêt : les vraies valeurs, µ et σ en particulier, seraient
connues exactement, aux erreurs d’observation près.
L’objet de l’inférence statistique est donc de fournir des outils pour établir un jugement
sur la population à partir des informations obtenues de l’échantillon.
2. Comment choisir l’échantillon ?

2.1 Planification de l’échantillon
Voici une marche à suivre pour planifier l’échantillonnage :

1. identifier et cerner la population : par exemple, si on souhaite effectuer une enquête
auprès des cadres d’une entreprise, il faut que le concept de cadre soit bien défini;
2. choisir le procédé d’observation et son mode de passation (questionnaire, test psy-

chologique, . . . );
3. identifier les bases de sondage disponibles et choisir la technique d’échantillonnage.

La seule méthode vraiment valable est le choix au hasard. Comment le réaliser
concrètement?
4. choisir les méthodes statistiques que l’on va utiliser. Si on attend d’avoir les données
pour faire ce choix, nous risquons – même inconsciemment – de choisir alors la
méthode qui favorise le plus nos hypothèses.
5. choisir la taille de l’échantillon. En principe, il vaut mieux avoir le plus de données

possibles, mais il ne faut pas oublier la contrainte du coût. Il faut donc veiller au
rapport Qualité-Prix.
D’autre part, plus la taille de l’échantillon est grande, plus les erreurs de mesure
risquent de se produire : codification absente ou erronée, cas particuliers et rares qui
n’ont pas été prévus dans le questionnaire, . . .
De plus, si la taille de l’échantillon est trop grande, en raison du coût élevé du
dépouillement, le questionnaire devra être simple, et se limiter parfois aux données
factuelles, faciles à obtenir auprès des enquêtés.
2.2 Représentativité de l’échantillon
Le but premier du statisticien est de choisir un échantillon au coût calculé tout en

maintenant une représentation la meilleure possible, cohérente avec les objectifs de l’étude.
La représentativité est donc liée à l’existence d’une base de sondage et à la mise en oeuvre
d’un processus de choix aléatoire des individus de l’échantillon.
Base de sondage
Pour que tout individu puisse figurer dans l’échantillon, il faut disposer au départ d’une
base de sondage complète, c’est-à-dire d’une liste, d’un recensement, de tous les individus
de la population étudiée.
Les bases de sondage sont innombrables : fichiers de personnels dans les entreprises,
fichiers de bénéficiaires de prestations dans les administrations sociales, annuaires télépho-
niques, listes électorales, etc.
L’annuaire téléphonique pourrait par exemple être sollicité pour élaborer un échantillon :
mais ce n’est pas une base de sondage exhaustive, car tout le monde n’a pas le téléphone
(cette restriction est de moins en moins vraie), et surtout de nombreux abonnés ont un
numéro privé non accessible (de 10 à 15 %). Si le tirage est aléatoire, l’échantillon ne sera
représentatif que des seuls ménages dont le numéro de téléphone est accessible. Ceux qui
protègent leur vie privée disposent certainement d’un niveau de vie supérieur aux autres.
Inversement, ceux qui n’ont pas le téléphone sont probablement plus pauvres. Le revenu
moyen, calculé sur un échantillon issu de l’annuaire, serait vraisemblablement différent de
celui calculé sur un échantillon de l’ensemble des ménages.
L’échantillon diffère de la population étudiée pour un caractère (numéro privé non

accessible), il est certain qu’il en diffère aussi pour d’autres qui lui sont liés, en particulier le
revenu. L’échantillon est biaisé, car conduisant à des résultats systématiquement déformés,
et les estimations bâties sur l’échantillon sont également biaisées.
Signalons également qu’il n’existe pas toujours de bases de sondage pour l’étude que
l’on souhaite faire. Si, par exemple, on veut enquêter sur la manière dont les homosexuels,
ou les drogués, se protègent du sida, on ne trouvera pas de base de sondage répertoriant
les homosexuels ou les drogués de la région où on souhaite effectuer cette étude.
2.3 Biais et erreurs dans l’échantillonnage
Rien ne garantit qu’un échantillon, même aléatoire, soit représentatif d’une population.
On peut avoir sélectionné un nombre disproportionné d’éléments dans l’une ou l’autre
catégorie.
Distinguons trois types d’erreurs : l’erreur d’échantillonnage, le biais d’échantillonnage
et les erreurs indépendantes de l’échantillonnage.
– On appelle erreur d’échantillonnage la différence entre la population et l’échantil-

lon qui est due uniquement à la particularité des éléments qui ont été choisis. Par
exemple, dans un échantillon de 100 personnes, si toutes mesurent plus de 2m05, on
doit logiquement inférer que tout le monde mesure plus de 2m05.
Ici, l’erreur est manifeste. Plus dangereuse est l’erreur de quelques cm qui ne défie
pas le raisonnement et pour laquelle il n’existe pas de moyen de contrôle. L’erreur
d’échantillonnage est donc avant tout le fruit du hasard. On peut y remédier en
augmentant la taille de l’échantillon.
– Les erreurs liées à une mauvaise méthode d’échantillonnage sont appelées biais
d’échantillonnage.
Le biais d’échantillonnage est une tendance à favoriser la sélection d’unités ayant
des caractéristiques particulières. Considérons l’exemple historique suivant. Lors des
élections américaines de 1936 entre Roosevelt et Landon, le “Literary Digest” avait
interrogé plusieurs millions de personnes et avait prédit une victoire bien tranchée de
Landon. Cette erreur était due au fait que l’échantillon avait été choisi dans les an-
nuaires téléphoniques. Or, au sortir de la crise, peu nombreux étaient les démocrates
qui pouvaient se permettre un tel luxe.
Le biais d’échantillonnage est très difficile à éviter et existe dans presque tous les
échantillons. Malheureusement, il n’est pas influencé par la taille de l’échantillon.
L’exemple le plus fréquent de biais est le biais de non-réponse, c’est-à-dire que
certains éléments de la population n’ont aucune chance de figurer dans l’échantillon
(par exemple les travailleurs qui ne sont pas à leur domicile lorsque les enquêteurs
passent pour les sondages).
Dans ce dernier cas, on peut tenter de remédier à la situation en multipliant les ten-
tatives de contact ou les moments de contact, en motivant les personnes contactées,
...
D’autre part, des biais d’échantillonnage peuvent également se produire lorsque la
base de sondage utilisée n’est pas conforme à la population que l’on souhaite étudier,
ou si elle est incomplète.
– Enfin, on appelle erreurs indépendantes celles qui sont dues uniquement à la

manière dont l’observation est faite (par exemple dans les sciences expérimentales :
mauvais fonctionnement du matériel, variations dans les conditions d’expériences;
dans les enquêtes : questions mal formulées, . . . ).
2.4 Sélection de l’échantillon
Voici quelques méthodes pour sélectionner l’échantillon.
A. Les méthodes non aléatoires
– L’échantillon de convenance
Cette méthode consiste à choisir les éléments les plus facilement accessibles. Chaque
jour, nous tirons des conclusions basées sur notre expérience personnelle.
Cet échantillonnage a l’avantage d’être peu cher mais on ne peut éviter un biais
d’échantillonnage (soit de non-réponse, soit dû à l’activité de minorités). Parfois, on
sélectionne un échantillon de convenance parce que ce sont les seuls échantillons dis-
ponibles. Il n’existe par exemple pas de base de sondage (complète) pour les drogués,
ou pour les homosexuels d’une région.
Ce type d’échantillon peut avoir une validité suffisante, à condition que l’on contrôle
suffisamment le processus. On peut, par exemple, effectuer chaque année une enquête
sur le Sida, auprès de drogués ou d’homosexuels, de manière à limiter le biais éventuellement
attaché à une enquête unique.
– L’échantillon de jugement
On choisit ici l’échantillon suivant les conseils de quelqu’un qui connaı̂t bien les
caractéristiques de la population. Il est utilisé dans les cas de populations très
hétérogènes, si l’échantillon est très petit, quand on veut assurer la représentativité
de toutes les classes de la population. Par définition, il est sujet au biais et donc n’est
à utiliser que s’il n’y a pas d’autre solution.
– L’échantillon par individus types

La méthode consiste à sélectionner des individus dont les caractéristiques sont les
plus proches des valeurs moyennes de l’ensemble de la population. Ainsi, pour des
résultats d’élections, les communes qui ont une composition de leur électorat selon
l’âge, la catégorie sociale, etc., et des résultats antérieurs proches de la moyenne
nationale, sont sélectionnés dans l’échantillon.
– L’échantillon par quota

Cette méthode est la plus célèbre et la plus employée des méthodes. Elle consiste à
bâtir un modèle réduit de la population étudiée, c’est-à-dire un échantillon, qui com-
porte des individus en mêmes proportions que la population pour des variables essen-
tielles, comme l’âge, le sexe, la catégorie de communes, la catégorie sociale, etc. Les
enquêteurs choisissent eux-mêmes les personnes à interroger en respectant les diverses
proportions, les quotas, qui leur sont fixées. Cette méthode ressemble à la méthode
par stratification (voir plus loin), mais en diffère par le mode de détermination des
personnes à interroger, qui n’est pas aléatoire.
B. Les méthodes aléatoires
– L’échantillon aléatoire simple

On choisit l’échantillon de telle façon que chaque élément de la population ait la
même probabilité d’être choisi. Pour le réaliser, il faudrait tirer au hasard dans une
urne où chaque élément de la population est représenté par un morceau de papier, ce
qui n’est évidemment pas toujours réalisable. Pratiquement, on utilise les tables de
nombres aléatoires. Ces tables groupent des échantillons de nombres tirés au hasard
qui ont résisté à tous les tests permettant de détecter un biais.
Comment utiliser ces tables? Supposons que, parmi 100 chefs d’orchestre, on désire
en choisir 10. Rangeons-les d’abord par ordre alphabétique et numérotons-les de 00
à 99 :
00. Abbado 25. Gloschmann 50. Mehta 75. Santini

01. André 26. Hannikainen 51. Mitropoulos 76. Sargent
02. Anasov 27. Hollingsworth 52. Monteux 77. Scherchen
03. Ansermet 28. Horenstein 53. Morel 78. Schippers
04. Argenta 29. Horvat 54. Mravinsky 79. Schmidt-Isserstedt
05. Barbirolli 30. Jacquillat 55. Newman 80. Sejna
06. Beecham 31. Jorda 50. Ormandy 81. Serafin
07. Bernstien 32. Karajan 57. Paray 82. Silvestri
08. Black 33. Kempe 58. Patane 83. Skrowaczewski
09. Bloomfield 34. Kertesz 59. Pedrotti 84. Slatkin
10. Bonynge 35. Klemperl 60. Perlea 85. Smetacek
11. Boult 36. Kletzki 61. Prêtre 86. Solti
12. Cantelli 37. Klima 62. Previra 87. Stien
13. Cluytens 38. Kondrashin 63. Previtali 88. Steinberg
14. Dorati 39. Kostelanetz 64. Prohaska 89. Stokowski
15. Dragon 40. Koussevitzky 65. Rekai 90. Svetlanov
16. Erede 41. Krips 66. Reiner 91. Swarowsky
17. Ferencsik 42. Kubelik 67. Reinhardt 92. Szell
18. Fiedler 43. Lane 68. Rignold 83. Toscanini
19. Fistoulan 44. Leinsdorf 69. Ristenpart 94. Van Otterloo
20. Fricsay 45. Maag 70. Rodzinski 95. Van Remoortel
21. Frühbeck de Burgos 46. Maarzel 71. Rosenthal 96. Vogel
22. Furtangler 47. Mackerras 72. Rozhdestvensky 97. Von Matacic
23. Gamba 48. Markevitch 73. Rowicki 98. Walter
24. Giulini 49. Martin 74. Sanderling 99. Watanabee
Dans la table des nombres aléatoires, on lit 10 nombres en les parcourant dans le
sens que l’on veut (horizontal, vertical, diagonal). Remarquons que le choix de ce sens
doit être effectué avant de regarder la table. On lit donc la table jusqu’à ce qu’on ait
trouvé ainsi 10 nombres différents entre 00 et 99. À chacun de ces nombres, on fait
correspondre le chef d’orchestre répertorié dans la liste alphabétique.
Par exemple : 15 Dragon
62 Previra
38 Kondrashin
... ...
Ces échantillons sont totalement exempts de biais. Seul le facteur chance peut encore
causer des surprises. La procédure que nous venons de décrire s’appelle l’échantillon-
nage aléatoire simple. D’autres types d’échantillonnages au moins partiellement
aléatoires sont utilisés.
– L’échantillonnage aléatoire systématique

Cette méthode consiste à choisir un élément d’une façon aléatoire et ensuite de
prendre ses suivants à un intervalle constant de distance. Par exemple, considérons
une enquête de Belgacom pour connaı̂tre les factures moyennes des abonnés. Si
on désire interroger vingt abonnés dans la zone de Bruxelles, il suffit de tirer un
numéro au hasard (par exemple, 02/1234567), puis ajouter 500 pour obtenir les
autres (02/1235067, 02/1235567, . . . ).
Il existe un danger de biais si les numéros ne sont pas attribués au hasard. Par
exemple, les firmes cherchent parfois à obtenir un numéro facile à retenir (par exemple
02/1235555).
– L’échantillon classifié ou stratifié

Ici, on choisit un échantillon aléatoire simple dans chacune des classes prédéterminées
d’une population. Ceci est souvent utilisé dans les enquêtes. Par exemple, si la liste
des ménages du quartier A contient l’indication de chaque catégorie sociale, une
méthode consiste à réaliser un sondage dans chacune de ces catégories, appelées
strates. Cette méthode améliore en général nettement la qualité du sondage.
– L’échantillon groupé à deux degrés

La méthode peut être illustrée comme suit : tirons par exemple un échantillon d’im-
meubles dans le quartier A (premier degré) et ensuite un échantillon de logements
dans chaque immeuble (deuxième degré). Cette méthode conduit à ne dresser la liste
des logements que pour les seuls immeubles désignés au premier tirage. Elle permet
aussi de concentrer les enquêtes et peut donc être moins coûteuse que le sondage
simple.
– L’échantillon par grappes

Dans cet échantillon, les individus sont tirés par grappes. Dans une enquête par
exemple, plutôt que d’interviewer 1000 personnes tirées au hasard à Bruxelles, on
divise la ville en une série de quartiers ou de groupes de maisons dans lesquels tous les
individus sont systématiquement interrogés. Ces groupes ou sous-groupes d’individus
sont appelés des grappes.
3. Distribution d’échantillonnage
Dans la suite du cours, nous supposerons que les échantillons sont obtenus par la
procédure d’échantillonnage aléatoire simple.
3.1 Distribution de probabilité d’une observation individuelle
– Supposons, par exemple, qu’un recensement belge récent nous donne la distribution
du nombre X d’enfants par ménage. Notons xi les valeurs de la variable X et fi la
fréquence des xi .
xi fi
0 0.1
1 0.2
2 0.3
3 0.15
4 0.10
5 0.05
6 0.05
7 0.03
8 0.02
Tableau V.1 –. Distribution du nombre d’enfants par ménage.
Comme cette distribution a été obtenue par un recensement, elle peut être considérée
comme la distribution de probabilité du nombre X d’enfants dans la population des
ménages.
On dira, plus simplement, qu’il s’agit de la distribution de probabilité (ou la loi de
probabilité) de la population et on la notera P (X = x) ou, plus simplement P (x) .
La deuxième colonne du Tableau V.1 (fréquences f i ) nous donne donc les probabi-
lités des résultats possibles xi . On pourra par conséquent écrire
P (X = 0) = 0.1 , P (X = 1) = 0.2 , ···
Le Tableau V.1 prendra alors la forme
xi P (X = xi )
0 0.1
1 0.2
2 0.3
3 0.15
4 0.10
5 0.05
6 0.05
7 0.03
8 0.02
Tableau V.2 –. Distribution de probabilité du nombre d’enfants par ménage.
Si nous tirons une famille au hasard (on dira que l’on effectue une observation indi-
viduelle), la variable aléatoire X1 , qui compte le nombre d’enfants de cette famille,
aura la même distribution de probabilité que la population. On aura, par exemple,
P (X1 = 1) = 0.2 , P (X1 = 2) = 0.3 , ...
En résumé
Chaque observation individuelle a la même distribution de probabilité P (x)

que la population.
– À partir de P (x) , on peut calculer µ , la moyenne de la population, et la variance σ 2 ,

en soulignant qu’ils sont aussi la moyenne et la variance d’une observation individuelle
tirée au hasard.
xi P (xi ) xi P (xi ) x2i x2i P (xi )
0 0.1 0 0 0
1 0.2 0.2 1 0.2
2 0.3 0.6 4 1.2
3 0.15 0.45 9 1.35
4 0.1 0.4 16 1.6
5 0.05 0.25 25 1.25
6 0.05 0.3 36 1.80
7 0.03 0.21 49 1.47
8 0.02 0.16 64 1.28
1 µ = 2.57 10.15
Nous aurons donc

X
E(X) = µ = xi P (xi ) = 2.57 = E(X1 ) ,
X
var(X) = σ 2 = x2i P (xi ) − µ2 = 10.15 − 6.6049 = 3.5451 = var(X1 ) .
– Supposons maintenant que nous tirions aléatoirement cinq ménages de la population,

afin d’obtenir un échantillon aléatoire simple de cinq ménages.
Calculons la probabilité qu’ils aient respectivement 1 , 2 , 0 , 1 et 4 enfants. Vu la
taille de la population, les variables aléatoires X1 , X2 , X3 , X4 et X5 associées aux
cinq tirages peuvent être considérées comme des variables aléatoires indépendantes.
Nous aurons donc
P (X1 = 1,X2 = 2,X3 = 0,X4 = 1,X5 = 4)
= P (X1 = 1) P (X2 = 2) P (X3 = 0) P (X4 = 1) P (X5 = 4)
= (0.2) (0.3) (0.1) (0.2) (0.1)
= 0.00012 .
On en déduit la propriété suivante :

Dans un échantillon aléatoire simple de taille n , les n observations

X1 ,X2 , · · · ,Xn sont indépendantes. La distribution de chaque observation Xi
est la même que celle de la population, c’est-à-dire P (x) . Chaque observation
a alors la même moyenne µ et le même écart type σ que la population.
3.2 Statistiques et paramètres
À partir d’un échantillon donné, on peut calculer, comme on l’a vu au Chapitre 2,

différentes valeurs caractéristiques, telles la moyenne ou la variance. De manière générale,
toute caractéristique qui peut être calculée à partir des valeurs d’un échantillon aléatoire
est appelée une statistique. Par exemple,
P
n P
n
Xi (Xi − X)2
i=1 i=1
X= et S2 =
n n
sont des statistiques. X et S 2 varient d’un échantillon à l’autre. Ce sont donc des variables
aléatoires.
Par contre, les valeurs caractéristiques d’une population sont appelées paramètres.
Ce sont des constantes caractérisant des lois de probabilité. Ainsi, la loi Normale est ca-
ractérisée par deux paramètres, µ et σ 2 .
3.3 Estimateur
Notre objectif est d’estimer les paramètres de la population.

Pour estimer µ , la moyenne de la population, il est logique de considérer X , la moyenne
de l’échantillon, encore appelée moyenne d’échantillonnage.
Définition
On appelle estimateur d’un paramètre d’une population une statistique
utilisée pour évaluer la valeur de ce paramètre.
Ici, X sera donc un estimateur de µ .

De la même façon, pour estimer σ 2 , la variance de la population, nous choisirons S 2 ,
la variance de l’échantillon. S 2 sera donc un estimateur de σ 2 . S 2 sera appelée la variance
d’échantillonnage.
3.4 Distribution d’échantillonnage de X
– La moyenne d’échantillonnage, X , est définie par

X1 + · · · + X n
X= ·
n
Comme les observations individuelles Xi sont des variables aléatoires, X sera égale-
ment une variable aléatoire.
Propriété 1
Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n extrait d’une

population de moyenne µ .
Alors E(X) = µ .
En effet,

X1 + X 2 + · · · + X n 1
E(X) = E = n
[E(X1 ) + E(X2 ) + · · · + E(Xn )]
n
1 1
= n
[µ + µ + · · · + µ] = n
·n µ = µ.
Ce résultat est intéressant car il signifie que la moyenne de l’échantillon, X , coı̈nci-

dera, en moyenne, avec la moyenne µ de la population.
Autrement dit, si on tire plusieurs fois un échantillon de taille n de la population,
et si on calcule à chaque fois la moyenne de l’échantillon, les valeurs trouvées auront
tendance à s’agglomérer autour de la moyenne µ (inconnue) de la population.
Lorsque E(X) = µ , on dira que X est un estimateur sans biais (ou non biaisé)
de µ .
– D’autre part, nous souhaiterions savoir dans quelle mesure la moyenne X fluctue
autour de µ .
On montre, par la Propriété 2, que la dispersion des valeurs de X autour de µ est
d’autant plus petite que la taille de l’échantillon est grande.
Propriété 2

population de moyenne µ et de variance σ 2 .
2
Alors var(X) = σn .
En effet,

X1 + X 2 + · · · + X n 1
var(X) = var = n2
(var(X1 ) + var(X2 ) + · · · + var(Xn ))
n
1 σ2
= n2
n σ2 = n
·
L’écart type de X sera alors

σ
σX = √ · (V.1)
n
Cette caractéristique de l’écart entre la moyenne X de l’échantillon et la moyenne
µ de la population représente l’erreur d’estimation. Elle est couramment appelée
erreur standard, ou encore écart type de l’échantillon.
La formule (V.1) montre explicitement comment l’écart type de X diminue lorsque
la taille de l’échantillon aléatoire augmente. Cela précise l’idée simple selon laquelle
plus l’échantillon est grand, plus X donne une estimation précise de la moyenne µ
de la population.
– Distribution de X pour une population Normale

Supposons que la population a une distribution Normale de moyenne µ et de variance
σ2 .
La propriété suivante donne la distribution de X .
Propriété 3
Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n issu d’une popu-
lation Normale de moyenne µ et de variance σ 2 .
Alors la distribution d’échantillonnage de X est une distribution Normale de
2
moyenne µ et de variance σn .
Ce résultat est en accord avec les deux propriétés précédentes. L’information sup-
plémentaire est que X a une distribution Normale si la population de départ est
Normale.
– Distribution de X pour une population quelconque

Le résultat suivant montre que, même si la population n’est pas Normale, la dis-
tribution d’échantillonnage de X sera approximativement Normale si la taille de
l’échantillon est suffisante.
Propriété 4 Théorème central limite

population de moyenne µ et de variance σ 2 .
Alors la distribution d’échantillonnage de X est approximativement (lorsque
2
n est grand), une distribution Normale de moyenne µ et de variance σn .
Remarques
– On considère en général qu’une valeur de n supérieure ou égale à 25 est suffisante
pour garantir le résultat ci-dessus.
– Ce théorème est valable quelle que soit la distribution de la population de départ.
La Figure V.1 illustre cette propriété. Elle reprend trois populations différentes. En
dessous de chaque population, des graphes successifs indiquent comment la forme
de la distribution d’échantillonnage de X se modifie lorsque la taille de l’échantillon
augmente.
La première colonne montre comment X se comporte lorsque l’échantillonnage est

réalisé à partir d’une population Normale. La distribution d’échantillonnage de X
est également Normale (fluctuant autour de µ avec de moins en moins d’erreur, au
fur et à mesure que n augmente).
Dans la seconde colonne, la distribution de la population est rectangulaire et, comme
prévu, la distribution d’échantillonnage de X revêt une forme Normale quand n
augmente. D’ailleurs, elle est déjà pratiquement Normale avec n égal à 5 ou 10 .
La troisième colonne est étonnante. Même avec une asymétrie de la distribution de la
population, la distribution d’échantillonnage de X tend encore à devenir Normale —
bien qu’il faille cette fois une taille d’échantillon un peu plus grande. (Noter qu’elle
devient pratiquement Normale à partir du moment où n = 10 ou 20 ).
3.5 Applications
Exemple 1 : supposons que la population des tailles des étudiants est Nor-
male de moyenne µ = 175 cm et d’ écart type σ = 8 cm.
1. Si on tire plusieurs échantillons de taille n = 4 et que l’on calcule à chaque fois la

moyenne X de l’échantillon, comment fluctuent ces moyennes?
2. Si on quadruple la taille de l’échantillon, comment varie l’erreur d’estimation, c’est-
à-dire l’écart type de l’échantillon ?
Solution :
1.
E(X) = µ = 175 cm ,
σ 8
σX = √ = = 4 cm .
n 2
Les valeurs de la moyenne de l’échantillon X varient donc autour de la moyenne
µ = 175 cm de la population avec un écart type de 4 cm.
2. On a toujours E(X) = µ = 175 cm. Mais, pour un échantillon aléatoire de taille

n = 16 , l’écart type de l’échantillon sera
σ 8
σX = √ = = 2 cm.
n 4
Un quadruplement de la taille de l’échantillon entraı̂ne un doublement de la précision.
Exemple 2 : soit une population Normale de moyenne µ et de variance σ 2 = 100 . On

extrait aléatoirement de cette population un échantillon de taille 25 .
Quelle est la probabilité que la moyenne d’échantillonnage s’écarte de plus de 3 unités de
la moyenne µ de la population?
Solution : on sait que

100
X∼N µ, .
25
On a donc
|X − µ| 3 3
P (|X − µ| > 3) = P √ > =P |Z| > .
σ/ n 10/5 2
La table de la loi normale réduite donne
P (|Z| > 1.5) = (1 − 0.9332) × 2 = 0.1336 .

Exemple 3 : calcul de la taille d’un échantillon. Soit une enquête destinée à évaluer
le poids moyen des Belges. On désire limiter l’erreur à 2 kg, avec un risque d’erreur de 5% .
Combien d’observations faut-il prendre si on suppose un écart type σ de 20 kg?
Solution : on désire que

P (|X − µ| ≤ 2) ≥ 0.95 .
Si on suppose que la variable poids suit une distribution Normale, on sait que

400
X ∼ N µ, .
n
La table de la loi Normale centrée réduite nous apprend que
P (|Z| ≤ 1.96) = 0.95 ,
soit
(1.96) · 20
P |X − µ| ≤ √ = 0.95 .
n
Pour que l’erreur soit inférieure à 2 , avec une probabilité égale à 0.95 , on choisira donc
n tel que
(1.96) · 20
√ =2,
n
soit 2
(1.96) · 20)
n= = 400 .
2
Exemple 4 : soit une population Normale de moyenne 50 et de variance 100 . On y

prélève un échantillon de taille n = 25 .
Quelle est la probabilité que la moyenne X soit dans l’intervalle [48,52]?
Solution : le problème posé revient à calculer P (48 ≤ X ≤ 52) :
X − 50
X ∼ N (50,4) donc Z= ∼ N (0,1) ,
2
P (48 ≤ X ≤ 52) = P (−1 ≤ Z ≤ 1) = 0.8270 .
Exemple 5 : le temps de service pour un client à une caisse d’un supermarché est une
variable aléatoire d’espérance 1’30” et de variance 1 minute.
Quelle est la probabilité que 50 clients puissent être servis en moins d’une heure?
Solution : soient X1 ,X2 , · · · ,X50 les temps de service (exprimés en minutes) des 50
clients.
Par le théorème central limite, on a

1
X ∼ N 1.5, .
50
La probabilité que les 50 consommateurs soient servis en moins d’une heure est la même
que la probabilité que la moyenne des temps de service des 50 consommateurs soit inférieure
à 1.2 minutes. On a donc

X − 1.5 1.2 − 1.5
P (X ≤ 1.2) = P √ ≤ √
1/ 50 1/ 50
= P (Z ≤ −2.121) = 0.017 .
Ce résultat n’est pas étonnant puisque, en moyenne, on attend que les 50 clients soient
servis en 75’.
Remarque : quel est le pourcentage des échantillons dont la moyenne X sera située entre
– µ − σX et µ + σX ?
– µ − 2σX et µ + 2σX ?
– µ − 3σX et µ + 3σX ?
Solution :

X−µ
– P (µ − σX ≤ X ≤ µ + σX ) = P −1 ≤ σX
≤1
= P (−1 ≤ Z ≤ 1)
= 0.682 où Z ∼ N (0,1) .
– P (µ − 2σX ≤ X ≤ µ + 2σX ) = P (−2 ≤ Z ≤ 2)

= 0.954 .
– P (µ − 3σX ≤ X ≤ µ + 3σX ) = P (−3 ≤ Z ≤ 3)

= 0.998 .
Nous pouvons en conclure que, si on tire un grand nombre d’échantillons, en moyenne
– 68.2% des échantillons conduiront à une valeur de X comprise entre µ−σX et µ+σX .
– 95.4% des échantillons conduiront à une valeur de X comprise entre µ − 2σX et

µ + 2σX .
– 99.8% des échantillons conduiront à une valeur de X comprise entre µ − 3σX et

µ + 3σX .
Population p(x) p(x) p(x)

n=1
Echantillons p(x) p(x) p(x)

n=2
p(x) p(x) p(x)

n=3
p(x) p(x) p(x)

n=5
p(x) p(x) p(x)
n = 10
p(x) p(x) p(x)
n = 20
Figure V.1 –. La distribution d’échantillonnage de X diffère de la distribution de

la population. La colonne de gauche représente l’échantillonnage à partir d’une
population Normale. À mesure que la taille de l’échantillon s’accroı̂t, l’écart
type de X diminue. Les deux colonnes suivantes montrent comment, en dépit du
caractère non Normal de la population, la distribution d’échantillonnage devient
approximativement Normale.
Chapitre VI
L’estimation par intervalle –

Les tests d’hypothèses
1. Estimation par intervalle de confiance
1.1 Introduction
Supposons que l’on veuille connaı̂tre le revenu moyen des habitants d’une grande ville.
Notons µ la vraie valeur de ce revenu moyen. µ est un paramètre inconnu. La seule façon
de le connaı̂tre exactement est de faire un recensement dans cette grande ville.
Prélevons, dans cette ville, un échantillon aléatoire simple de 100 habitants. Une “bon-
ne” estimation de µ est donnée par la moyenne d’échantillonnage X . Si nous prélevons un
second échantillon, on obtiendra presque certainement une autre valeur pour X . D’autre
part, comme X est une variable aléatoire continue, la probabilité pour que X soit exacte-
ment égal à µ est nulle.
C’est pourquoi, lors de l’estimation d’un paramètre, on donnera non seulement sa valeur
estimée, mais également une mesure du risque d’erreur que l’on commet.
Plus souvent cependant, on déterminera autour de la valeur estimée un intervalle

dont on a de bonnes raisons de croire qu’il contiendra la vraie valeur du paramètre. Ainsi,
étant donné un estimateur G d’un paramètre γ , on s’efforce de déterminer de part et
d’autre de G les limites L1 et L2 d’un intervalle tel qu’il ait une probabilité P de conte-
nir γ . En pratique, on se fixe cette probabilité, appelée seuil de confiance; on prend
§ VI. L’estimation par intervalle – Les tests d’hypothèses
généralement P = 0.95 ou 0.99 . Si on choisit un seuil de confiance P = 0.95 , cela si-

gnifie que si on tire un grand nombre d’échantillons, l’intervalle contiendra la vraie valeur
(inconnue) du paramètre, environ 95 fois sur 100.
On peut écrire
P (L1 < γ < L2 ) = P = 1 − α .
Cette probabilité traduit donc la confiance que nous avons dans l’affirmation : γ est compris
entre L1 et L2 . α est appelé le niveau d’incertitude de l’intervalle de confiance.
Un intervalle de confiance est parfois appelé, dans le langage courant, une fourchette
d’estimation.
1.2 Intervalle de confiance pour le paramètre µ d’une loi Nor-

male – σ est connu
Supposons, dans l’exemple précédent, que les revenus des habitants de la grande ville
suivent une distribution Normale N (µ,σ 2 ) où σ est connu. Supposons, par exemple, que
σ = 2000 €. Construisons un intervalle de confiance pour µ .
Dans le chapitre précédent, nous

avons vu que la moyenne d’échantillonnage, X , suivait
σ2
dans ce cas une distribution N µ, n . Par conséquent, Z = X−µ √σ suit une distribution
n
N (0,1) . Nous avons
!
X −µ
P z α2 ≤ ≤ z1− α2 = 1−α
√σ
n
ou encore
σ σ
P X − z1− α2 √ ≤ µ ≤ X + z1− α2 √ = 1−α
n n
α
où z1− α2 est le quantile d’ordre 1 − 2
de la distribution N (0,1) .
Remarques :
– Par symétrie de la fonction de densité de la distribution N (0,1) , on a
z1− α2 = −z α2 ·
– Les tables de la distribution N (0,1) nous donnent les valeurs suivantes pour les
quantiles zu en fonction de u :
u 0.995 0.99 0.975 0.95
zu 2.58 2.33 1.96 1.645
h i
– L’intervalle de confiance Iα (µ) = X − z1− α2 √σ
, X + z1− α2 √σn est centré en X .
n

Sa longueur dépend entre autre de l’écart type de X √σn , c’est-à-dire de l’erreur
d’estimation.
Exemple : si, dans l’échantillon des 100 habitants, le revenu moyen est de 7348 €,
l’intervalle de confiance I pour µ , le revenu moyen des habitants de la grande ville, sera
(si nous choisissons un niveau d’incertitude α = 0.05 ) :

σ σ
Iα (µ) = X − z1− 2 √ , X + z1− 2 √
α α
n n

2000 2000
I0.05 (µ) = 7348 − 1.96 , 7348 + 1.96
10 10
= [6956 , 7740] .
Remarques :
1. On a
σ σ
P X − 1.96 √ ≤ µ ≤ X + 1.96 √ = 0.95 . (VI.1)
n n
Cela signifie que si on recommence, par exemple, 20 fois le processus de tirer un
échantillon aléatoire simple de 100 habitants, la vraie valeur de µ n’en sera pas
affectée. Par contre, x sera probablement différent d’un échantillon à l’autre. On
obtient ainsi 20 intervalles différents. Nous pouvons donc déduire de la formule (VI.1)
qu’environ 95 % de ceux-ci, soit 19 d’entre eux, devraient contenir la vraie valeur
inconnue de µ .
2. Le paramètre µ de la population est et reste constant. C’est l’intervalle d’estimation

qui est aléatoire car ses bornes dépendent de la variable aléatoire X.
3. Si la taille de l’échantillon augmente, l’écart type d’échantillon σX = √σn diminue, et la

longueur de l’intervalle de confiance diminue. Cet accroissement de la précision est le
gain résultant de la taille de l’échantillon. Par contre, si l’écart type de la population,

σ , augmente, la longueur de l’intervalle de confiance augmente également.
4. Si le seuil de confiance d’un intervalle de confiance augmente par exemple de 95 % à

99 % , la longueur de l’intervalle de confiance va également augmenter.
1.3 Intervalle de confiance pour le paramètre µ d’une loi Nor-

male – σ est inconnu
Dans le paragraphe précédent, on a supposé l’écart type σ de la population connu. Ce

n’est en général pas le cas.
Pour obtenir un intervalle de confiance pour µ , nous devons estimer σ . Pour ce faire,
nous pouvons utiliser S 2 , la variance d’échantillonnage. Cependant,
n
X
2
S = 1
n
(Xi − X)2
i=1
et
E(S 2 ) = n−1
n
σ2 ;
S 2 n’est donc pas un estimateur non biaisé de σ 2 .

Par contre,
Xn
02
S = n−11
(Xi − X)2
i=1
2
est un estimateur non biaisé de σ .
Nous estimerons donc σ 2 par S 0 2 .
Remarques :
– Si la taille de l’échantillon est suffisamment grande ( n ≥ 30 ), on peut montrer

que la distribution d’échantillonnage de la statistique X−µ
S0
√
sera approximativement
n
une distribution N (0,1) . L’intervalle de confiance pour µ au niveau d’incertitude α
prendra alors la forme

S0 S0
Iα (µ) = X − z1− α2 √ , X + z1− α2 √ .
n n
– Si la taille de l’échantillon est petite ( n < 30 ), la distribution d’échantillonnage de

la statistique Tn = X−µ S0
√
est une distribution de Student à (n − 1) degrés de liberté.
n
Sa fonction de densité aura la forme suivante :
0.4 N(0,1)
n=3
n=1
0.2
0.1
x
-3 -2 -1 0 1 2 3
Figure VI.1 –.
L’intervalle de confiance pour µ sera alors

S0 S0
Iα (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √
n n
α
où tn−1,1− α2 est le quantile d’ordre 1 − 2
de la loi de Student à (n − 1) degrés de
liberté.
Les valeurs de ces quantiles sont fournies dans des tables (voir annexe).
Exemple : dans une classe, on extrait un échantillon aléatoire simple de 4 notes : 64, 66,
89 et 77 . On suppose que les notes de la classe suivent une distribution Normale.
Calculer un intervalle de confiance à 95 % pour la moyenne des notes de toute la classe.
Solution : ici n = 4 est petit; l’intervalle de confiance pour µ , la moyenne des notes de
toute la classe, sera

S0 S0
Iα (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ .
n n
On a
– α = 0.05 donc tn−1,1− α2 = t3,0.975 = 3.182 ;

0
– s 2 = 132.7 ;
– x = 74 ;
et donc
" √ √ #
132.7 132.7
I0.05 (µ) = 74 − 3.182 √ , 74 + 3.182 √
4 4
= [56,92] .
Avec un intervalle de confiance à 95 %, on conclut que la note moyenne de la classe

entière se situe entre 56 et 92. C’est un intervalle bien grossier dû à une trop petite taille
de l’échantillon.
1.4 Intervalle de confiance pour une proportion
Nous ne considérons ici que le cas des grands échantillons ( n ≥ 30 ).
Considérons l’ensemble des étudiants et intéressons-nous à la proportion

p de fumeurs.
Pour estimer p , on extrait, de la population des étudiants , un échantillon
aléatoire simple de 100 étudiants. Appelons X la variable aléatoire qui compte le nombre
de fumeurs dans cet échantillon.
Alors, X ∼ Bi(n,p) où n = 100 .
Nous avons vu précédemment que l’on pouvait approximer la variable aléatoire bino-
miale X par une variable aléatoire Normale X ≈ N (np,npq) .
D’autre part, nous pouvons estimer p par p̂ = Xn . De plus,
X pq
≈ N p,
n n
et donc
p̂ − p
p pq ≈ N (0,1) .
n
L’intervalle de confiance pour p s’écrira
" r r #
p̂q̂ p̂q̂
Iα (p) ≈ p̂ − z1− α2 , p̂ + z1− α2
n n
α
où z1− α2 est le quantile d’ordre 1 − 2
de la loi N (0,1) .
Dans notre exemple, si le nombre de fumeurs dans l’échantillon des 100 étudiants
est de 40, on aura, avec un niveau d’incertitude de 0.05,
p̂ = 0.4 , q̂ = 0.6
et " r r #
0.4 × 0.6 0.4 × 0.6
I0.05 (p) ≈ 0.4 − 1.96 , 0.4 + 1.96
100 100
= [0.304 , 0.496] .
2. Tests d’hypothèses
En se basant sur une théorie, une expérience antérieure ou une argumentation logique,
l’expérimentateur est amené, au cours de sa recherche, à formuler une hypothèse au sujet
du phénomène qu’il étudie et de la variable qu’il mesure.
Le test d’hypothèses est le processus qui consiste à confronter l’hypothèse émise avec
la réalité expérimentale en vue de prendre une décision quant à sa validité (accepter ou
rejeter l’hypothèse).
2.1 Principes généraux des tests d’hypothèses
Exemple 1 : supposons que nous lancions 100 fois une pièce de monnaie, et que nous
observions 65 fois “pile” . Soit X la variable aléatoire qui compte le nombre de “pile” :
x = 65 .
Si la pièce est équilibrée, nous nous attendons à obtenir un résultat proche de x =
50 , mais nous ne sommes pas surpris puisque nous savons que les résultats d’une telle
expérience peuvent s’écarter de 50 par simple hasard. Cependant, un certain scepticisme
peut nous amener à croire que ce résultat pourrait ne pas être dû seulement au hasard;
cela voudrait dire que nous pensons à un facteur causal (une monnaie mal équilibrée),
responsable de l’écart obtenu entre la valeur observée ( x = 65 ) et la valeur que l’on aurait
pu attendre avec une monnaie équilibrée ( x = 50 ).
Le problème est posé : notre monnaie est-elle équilibrée , ou est-elle biaisée en faveur
de “pile”? Pour répondre à cette question, nous devons décider ici entre deux hypothèses :
“la pièce est équilibrée” ou “la pièce est biaisée, en faveur de pile” .
La première hypothèse est celle qu’on veut tester (il s’agit souvent d’une hypothèse
de non différence). Nous l’appellerons l’hypothèse nulle, que nous noterons H0 . L’autre
hypothèse, que nous appellerons l’hypothèse alternative, sera notée HA . Si p désigne

la proportion de “pile” lors des 100 lancers, ces hypothèses s’écriront :
H0 : p = 0.5 ,
HA : p > 0.5 .
Si l’hypothèse nulle est vérifiée, X , la variable aléatoire qui compte le nombre de fois qu’on
obtient “pile” en lançant 100 fois une pièce de monnaie, aura une distribution Bi (100,0.5) .
Nous avons vu que X peut être approximée par une variable aléatoire N (50,25) et nous
utiliserons cette approximation dans cet exemple.
Solution 1 : calcul de la p-valeur
Tout d’abord, nous devons admettre qu’il est possible d’obtenir jusqu’à 100 fois “pile”
sur 100 lancers d’une pièce de monnaie équilibrée, simplement par chance ! Il faut donc aussi
admettre que le résultat xobs = 65 est possible sans que cela implique nécessairement
une sinistre machination d’un adversaire au jeu de “pile ou face”.
Cependant, la probabilité d’obtenir 100 fois “pile” est sans aucun doute tellement faible
qu’elle peut être négligée, et, avec ce résultat, vous affirmeriez avec une certitude presque
absolue que la pièce de monnaie n’est pas équilibrée.
Par conséquent, notre problème revient à trouver la probabilité d’obtenir, par chance,
65 fois “pile” ou plus en utilisant une monnaie équilibrée. Nous noterons cette probabilité
PH0 (X ≥ 65) , l’indice H0 signifiant que nous calculons cette probabilité en supposant
l’hypothèse H0 vérifiée.
Ce calcul nous est déjà familier :
X est approximativement N (µ,σ 2 ) avec µ = n p = 50 ,
et σ 2 = n p q = 25 .
On a donc
X −µ
Z= ∼ N (0,1) .
σ
On obtient

X−µ 65 − 50
PH0 (X ≥ 65) = P ≥
σ 5
= P (Z ≥ 3)
= 1 − P (Z ≤ 3)
= 1 − 0.99865
= 0.00135 .
On trouve donc que la probabilité d’obtenir 65 fois “pile” ou plus, en lançant 100 fois
une pièce de monnaie équilibrée, n’est que 0.00135 , ce qui est vraiment très peu. Cette
valeur de 0.00135 est appelée “probabilité critique pour H0 ” ou encore “ p-valeur pour
H0 ”. Elle mesure ce que les données disent de la crédibilité de H0 . Si la pièce est équilibrée
( p = 21 ), nous avons à peu près une chance sur mille d’observer un nombre de pile supérieur
ou égal à 65 . Cette probabilité est trop faible. Nous rejetterons donc H0 et la décision
logique sera donc de conclure que la monnaie n’est pas équilibrée.
Notre décision n’est cependant pas une certitude absolue. Le but des tests d’hypothèses
est de nous aider à porter un jugement face à une incertitude, avec l’avantage de pouvoir es-
timer le degré d’incertitude. Dans notre exemple, la possibilité d’obtenir, avec une monnaie
équilibrée, 65 fois “pile” ou plus existe, et la probabilité de cette possibilité est 0.00135 .
Par conséquent, la probabilité d’avoir pris une décision fausse est 0.00135.
En général, on rejette H0 si la p-valeur pour H0 est faible, c’est-à-dire si elle est inférieure
à une valeur préalablement fixée, qui est appelée le niveau du test d’hypothèses, et qui
est notée α . Généralement, on choisit α = 0.05 , ou α = 0.01 .
L’ensemble des valeurs qui conduisent au rejet de H0 s’appelle la région critique du
test.
Dans notre exemple, la p-valeur est égale à 0.00135 .
0.00135 < 0.05 et 0.00135 < 0.01 .
On rejette donc H0 aux niveaux 0.05 et 0.01 .
Solution 2 : calcul de la région critique d’un test d’hypothèses
On peut résoudre un test d’hypothèses en calculant directement la région critique du

test.
Calculons donc la région critique du test d’hypothèses précédent, pour un niveau de

5% (c’est-à-dire α = 0.05 ).
Nous rejetterons donc H0 , au niveau α = 0.05 , si le nombre de “pile” observé X est
“trop grand”, c’est-à-dire si X ≥ k où la constante k est déterminée par
PH0 (X ≥ k) = 0.05 .
La variable aléatoire X peut être approximée par une variable aléatoire N (50,25) .
On a donc
k − 50
PH0 (X ≥ k) = P Z ≥ = 0.05 .
5
Les tables de la loi N (0,1) (annexe) donnent :
k − 50
= 1.64
5
et donc
k = 58.20 .
Comme la valeur observée de X , notée xobs , est supérieure à la valeur de k :
xobs = 65 ≥ k = 58.20 ,
on rejette H0 au niveau α = 0.05 . La région critique sera donc {x : x ≥ 58.20} . Cela

signifie que, si l’hypothèse nulle est vraie (la pièce est équilibrée), on n’a que 5 % de chance
de trouver un échantillon pour lequel le nombre de “pile” dépasse 59 .
Exemple 2 : un test de mémoire consiste à présenter aux étudiants, pendant deux mi-
nutes, sur transparent, les images de 24 objets. On demande ensuite aux étudiants de
tenter de retranscrire en deux minutes la liste des objets. On note pour chaque étudiant le
nombre de mots retenus. On sait que les résultats de l’application de ce test de mémoire sur
un grand nombre d’étudiants est une variable aléatoire Normale de moyenne µ = 17.683
et de variance σ 2 = 6.4 .
Une firme pharmaceutique développe une nouvelle potion destinée à stimuler la mémoire
à court terme et aider, entre autres, les étudiants à bloquer un maximum de matière la
veille d’un examen.
Pour pouvoir mettre ce médicament sur le marché, la firme doit prouver que le médi-
cament a réellement de l’effet et elle décide d’entreprendre une campagne d’essais de son
médicament sur une série d’étudiants. Plus précisément, elle soumet ce test de mémoire à
un groupe d’étudiants auxquels elle a, au préalable, fait prendre le médicament.
Notons µ0 la moyenne de la population de référence : celle des étudiants n’ayant pas

pris le médicament; nous savons que µ0 = 17.683 .
Notons µ la moyenne de la population hypothétique des étudiants qui prendraient
le médicament. Cette valeur µ est évidemment inconnue car elle fait l’objet du test d’hy-
pothèses.
Tester si le médicament a de l’effet sur la mémoire se fait donc en trois étapes.
1. – On fixe l’hypothèse nulle et l’hypothèse alternative.
- L’hypothèse nulle sera une affirmation de “non différence”. Nous dirons

donc ici qu’il n’y a pas de différence entre le score moyen µ0 de la population
des étudiants n’ayant pas pris le médicament et le score moyen µ de la
population hypothétique des étudiants ayant pris le médicament; ou encore
que le médicament n’a pas d’effet sur la mémoire à court terme.
Nous l’écrirons sous la forme générale :
H0 : µ = µ 0 ,
c’est-à-dire dans l’exemple :
H0 : µ = 17.683 .
- L’hypothèse alternative peut être formulée de différentes façons. Dans

cet exemple, on s’attend à une augmentation du score chez les étudiants
ayant pris le médicament et l’hypothèse alternative (celle que l’on souhaite
mettre en évidence) s’écrira donc sous la forme générale
HA : µ > µ 0 ,
c’est-à-dire dans l’exemple :
HA : µ > 17.683 .
L’hypothèse alternative affirme donc que le médicament a pour effet d’aug-

menter la mémoire à court terme.
– On fixe la taille de l’échantillon; par exemple ici n = 10 .

– On fixe le niveau du test; par exemple α = 0.05 (ou α = 5 %).
2. On supposetemporairement
que l’hypothèse nulle est vraie. X sera une variable
σ2
aléatoire N µ0 , n , c’est-à-dire une variable aléatoire N (17.683,0.64) .
On calcule la région critique. On rejettera donc H0 , au niveau α = 0.05 , si X ≥ k
où la constante k est déterminée par PH0 (X ≥ k) = α . Or, sous H0 ,
X ∼ N (17.683,0.64) .
On se demande donc à quel seuil correspond la valeur α = 0.05 .

Donc
PH0 (X ≥ k) = 0.05

X − 17.683 k − 17.683
⇔ P H0 √ ≥ √ = 0.05
0.64 0.64

k − 17.683
⇔ P Z≥ √ = 0.05 .
0.64
Dans les tables de la distribution N (0,1) , on trouve P (Z ≥ 1.64) = 0.05 . Donc
k − 17.683
√ = 1.64
0.64
c’est-à-dire k = 18.995 .
L’indice “ H0 ” est présent pour insister sur le fait que la probabilité est calculée
en supposant que l’hypothèse H0 est vraie, c’est-à-dire que X a une distribution de
moyenne 17.683.
Cette valeur de 18.995 correspond au seuil critique; elle définit la région de rejet de
l’hypothèse nulle {(x1 , · · · ,xn )} : x ≥ 18.995} . Cela signifie que, si l’hypothèse nulle
est vraie (le médicament n’a pas d’effet), on n’a que 5 % de chance de trouver un
échantillon dont la moyenne des scores soit supérieure à 18.995.
3. On tire l’échantillon. Si xobs est dans la région de rejet, on considère que l’hypothèse
nulle peut être rejetée. Sinon, elle ne sera pas rejetée.
Dans notre exemple, les scores des dix étudiants de l’échantillon sont
19 , 18 , 16 , 20 , 21 , 24 , 23 , 18 , 19 , 17 .
On a xobs = 19.5 . Cette valeur dépasse le seuil critique de 18.995. L’hypothèse nulle
est donc rejetée. On admet donc que le médicament a un effet positif sur la mémoire.
Dans ce contexte, on peut interpréter la valeur α = 0.05 . On peut en effet expliquer

les résultats du test de deux façons :
– H0 est vraie; nous avons donc été particulièrement malchanceux et nous sommes
tombés par hasard sur un échantillon particulièrement improbable : par exemple
dix étudiants qui, sans faire appel au médicament, bénéficient d’une meilleure
mémoire que la moyenne.
– H0 est fausse; il n’est donc pas surprenant de trouver une valeur aussi grande
de X .
On optera pour la seconde explication, la plus plausible. Il nous reste cependant un

léger doute : il reste possible que la première explication soit la bonne. La conclusion
est valable avec un risque d’erreur maximum de 5 %.
Calcul de la p-valeur :
On peut également résoudre ce test en utilisant la p-valeur.

L’avantage de la p-valeur est qu’elle fournit une idée précise du risque d’erreur qu’on
encourt en rejetant H0 alors que H0 est vraie, contrairement au test classique qui ne donne
pas cette valeur précise mais fixe arbitrairement la valeur de l’erreur maximum admise.
Dans notre exemple, la valeur observée de X vaut 19.5 . On doit donc calculer

19.5 − 17.683
PH0 (X ≥ 19.5) = PH0 Z ≥ √ = P (Z ≥ 2.27) = 0.0116 .
0.64
La p-valeur est égale à 0.0116 < 0.05 .
On rejette donc H0 au niveau α = 0.05 . Le risque d’erreur que l’on commet, c’est-à-dire
la probabilité d’avoir pris une décision fausse, est égal à 0.0116 .
Remarques :
1. Prenons un autre échantillon de dix étudiants et supposons que le score moyen est
de xobs = 18.2 objets reconnus. On a
PH0 (X ≥ 18.2) = P (Z ≥ 0.646) = 0.25785 > 0.05 .
Donc, bien que 18.2 > µ0 = 17.683 , on ne rejettera pas H0 . Il y a ici plus d’une
chance sur quatre de rencontrer un échantillon d’étudiants qui obtiennent un tel
résultat même si le médicament n’est pas utilisé.
On conclura donc que le médicament n’a pas d’effet.
2. Dans notre exemple, si on résoud le test d’hypothèses en calculant explicitement la

région critique, la règle de décision pourra se résumer de la façon suivante :
rejeter H0 si xobs ≥ k ,
accepter H0 si xobs < k ,
où la constante k est déterminée en fonction du niveau du test
α = PH0 (X ≥ k) .
On peut visualiser ces éléments sur le graphe de la distribution d’échantillonnage de

X .
Région d'acceptation Région de rejet

H0 accepté H1 accepté
α
X
µ0 = 17.68
Figure VI.2 –.
2.2 Tests uni- et bi-directionnels
Dans l’exemple précédent, nous avons, a priori, supposé que le score moyen des indi-
vidus ayant pris le médicament était supérieur au score moyen des étudiants n’ayant pas
pris le médicament; nous nous sommes donc intéressés à la surface de la partie droite de la
distribution d’échantillonnage de X . Il s’agissait d’un test unidirectionnel, la direction
de l’hypothèse alternative ayant été spécifiée.
Dans beaucoup de cas, cependant, l’expérimentateur s’intéressera seulement à une
différence possible sans a priori concernant la direction de cette différence. Le test sera
alors bi-directionnel, et le niveau α sera réparti de manière équivalente entre les deux
extrémités de la distribution d’échantillonnage.
Les différents tests possibles sont représentés ci-dessous :
a) H0 : µ = µ0 ,
HA : µ > µ 0 .
1-α
Figure VI.3 –.
On rejette H0 pour de “grandes” valeurs de xobs , c’est-à-dire si xobs ≥ k où k est

défini par
PH0 (X ≥ k) = α .
On parlera ici de test unilatéral à droite. La direction de la règle de rejet reprend
celle de l’alternative.
b) H0 : µ = µ0 ,
HA : µ < µ 0 .
On rejette H0 pour de “petites” valeurs de xobs , c’est-à-dire si xobs ≤ k où k est
défini par
PH0 (X ≤ k) = α .
On parlera ici de test unilatéral à gauche. La direction de la règle de rejet reprend
celle de l’alternative.
1-α
α
Figure VI.4 –.
c) H0 : µ = µ0 ,
H1 : µ 6= µ0 .
On rejette H0 pour de “grandes” ou de “petites” valeurs de xobs , c’est-à-dire si
xobs ≤ k1 ou si xobs ≥ k2 où k1 et k2 sont définis par
α α
PH0 (X ≤ k1 ) = et P H 0 (X ≥ k 2 ) = ·
2 2
1-α
α/2
α/2
Figure VI.5 –.
Ici, le niveau α sera réparti de manière équivalente entre les deux extrémités de la
distribution d’échantillonnage.
Ces tests peuvent également être résolus à partir du calcul de la p-valeur.

2.3 Erreurs de première et de deuxième espèces
Dans un test statistique, deux types d’erreurs peuvent être commises :

1. Rejeter H0 , alors que H0 est vraie.
Cette erreur est appelée “erreur de type I”. La probabilité de cette erreur est notée
α.
Dans l’exemple précédent, la p-valeur donne la probabilité de l’erreur de type I :
PH0 (X ≥ 19.5) = 0.0116 .
Par contre, si on effectue un test d’hypothèses en recherchant la région critique, on

fixe a priori un niveau d’erreur de type I maximum admis (généralement 5 %, ou
1 %).
2. Accepter H0 alors que HA est vraie.

Cette erreur est appelée “erreur de type II”.
La probabilité de cette erreur est notée β .
Un bon test est celui qui minimise ces deux erreurs, mais pour une taille d’échantillon
donnée, diminuer une erreur augmente généralement l’autre. On peut cependant réduire
simultanément α et β en augmentant la taille de l’échantillon.
Pour mieux comprendre la philosophie sous-jacente aux erreurs, prenons un exemple
de la vie courante. Imaginons une cour d’assises. Pour un accusé, il y a deux hypothèses
possibles : coupable ou innocent. Il existe des solutions qui minimisent une des deux erreurs,
c’est de condamner ou d’acquitter tout le monde.
Pratiquement, on utilise le principe du droit Napoléonien qui dit qu’il vaut mieux cent
coupables en liberté qu’un innocent en prison. L’hypothèse nulle est alors bien définie :
l’accusé est présumé innocent.
L’erreur de type I consiste à condamner un innocent. L’erreur de type II consiste à
innocenter un coupable.
On considère toujours que l’erreur de type I est la plus grave et on effectuera un test
en bornant la probabilité de cette erreur par α (en général, on prendra α = 0.05 ou 0.01 ).
2.4 Test sur le paramètre p d’une loi binomiale
Les problèmes d’inférence concernant la fréquence de réalisations d’un événement sont

courants en expérimentation scientifique, mais aussi dans la vie quotidienne. Les rapports
scientifiques, les journaux, la publicité font état chaque jour de statistiques donnant soit
le taux de mortalité due à la tuberculose ou au cancer, soit le pourcentage de réussite à

l’université, soit encore les chances de succès d’un candidat aux élections présidentielles.
Le modèle est généralement celui d’une loi binomiale. On répète n fois une expérience
élémentaire dont la probabilité de succès est p , et on s’intéresse au nombre X (effectif)
ou à la proportion Xn (fréquence) de succès.
Nous avons examiné précédemment en détail un exemple de comparaison d’une pro-

portion à une valeur théorique.
Une valeur p0 est préalablement posée, et l’hypothèse nulle est
H0 : p = p 0 .
L’alternative peut, suivant les cas, s’exprimer sous une des formes
HA : p < p 0 ,
HA : p > p 0 ,
HA : p 6= p0 .
L’expérimentation consiste à répéter n fois l’expérience élémentaire et à noter le nombre

X de succès. En vertu de l’hypothèse nulle
X est Bi(n,p0 ) .
Il y aura rejet de l’hypothèse nulle lorsque la p-valeur sera inférieure à un seuil que l’on se
sera fixé.
PH0 (X ≤ xobs ) ≤ α si HA : p < p0 ,
PH0 (X ≥ xobs ) ≤ α si HA : p > p0 ,



PH0 (X ≤ xobs ) ≤ α/2 
si HA : p 6= p0 .

ou PH0 (X ≥ xobs ) ≤ α/2 
Le test peut se réaliser de deux façons différentes, suivant que la variable aléatoire peut
ou ne peut pas être approximée par une variable aléatoire Normale.
2.4.1. Test basé sur la distribution binomiale

Exemple : dans une maternité, on a enregistré un jour la naissance de 9 garçons et de

16 filles. Peut-on conclure, au niveau α = 0.05 , que la fréquence de naissances de garçons
est inférieure à 0.5?
Les hypothèses sont
H0 : p = 0.5 ,
HA : p < 0.5 .
Si H0 est vraie, le nombre X de naissances mâles sur 25 naissances est une variable aléatoire
Bi(25,0.5) . On trouve immédiatement dans les tables que
PH0 (X ≤ 9) = 0.1148 .
On voit que cette probabilité (la p-valeur) est supérieure à α = 0.05 et rien ne permet donc
de conclure que la probabilité de naissance d’un garçon est inférieure à 0.5 .
2.4.2. Test basé sur la distribution Normale
Lorsque n est grand, et p voisin de 0.5 , nous avons vu qu’une variable aléatoire Bi(n,p)
pouvait être approximée par une variable aléatoire N (n p,n p q) . On a vu que cette
approximation est satisfaisante pour autant que n p ≥ 5 et n q ≥ 5 .
Exemple : un sociologue affirme que la moitié de la population belge est favorable au

travail à temps partiel. L’examen de 1000 personnes révèle que 460 d’entre elles y sont
favorables. Ce sociologue a-t-il raison?
Les hypothèses sont :
H0 : p = 0.5 ,
HA : p < 0.5 .
Le nombre X de personnes favorables au travail à temps partiel peut être approximé par
une variable aléatoire N (n p,n p q) . D’après l’hypothèse nulle
X est N (500,250) .
On rejettera H0 au niveau α si la p-valeur est inférieure à α , c’est-à-dire si PH0 (X ≤

460) ≤ α .
Choisissons α = 0.05 . On a

460−500
PH0 (X ≤ 460) = P Z ≤ √
250
= P (Z ≤ −2.53)
= 1 − P (Z ≤ 2.53)
= 0.0057 < 0.05 .
On rejette donc H0 , au niveau α = 0.05 . On peut donc affirmer que la proportion de

personnes favorables au travail à temps partiel dans la population belge est inférieure à
0.5 .
2.5 Exemples
1. Une association de consommateurs teste le contenu exact de boı̂tes de petits pois.
Le poids net égoutté annoncé sur l’étiquette est de 250 gr. Sachant que dans ce
genre de situation, l’écart-type pour une boı̂te est de 2 % du poids, soit 5 gr, quelles
conclusions tirer d’un échantillon de 120 boı̂tes donnant une moyenne observée de
249 gr?
Solution : il semble logique de considérer comme hypothèse nulle : “le poids an-
noncé est correct”, et comme hypothèse alternative : “le poids réel est inférieur au
poids annoncé”, c’est-à-dire


 H0 : µ = 250 ,

 HA : µ < 250 .
Résolvons cet exercice de deux manières :
(a) Calculons la p-valeur
!
249 − 250
PH0 (X ≤ 249) = P Z≤
√5
120
= P (Z ≤ −2.19) = 0.01426.
Comme 0.01426 < 0.05 , on rejettera H0 au niveau α = 0.05 .

(b) Calculons la région critique, c’est-à-dire la zone de rejet de H0
Fixons α = 0.05 .
La zone de rejet est calculée par
PH0 (X ≤ k) = 0.05 ,
c’est-à-dire !
k − 250
P Z≤ = 0.05 .
√5
120
Les tables de la loi N (0,1) nous donnent
k − 250
= −1.65
√5
120
et finalement
1.65 × 5
k = 250 − √ = 249.25 .
120
La règle est de rejeter H0 si xobs ≤ 249.25 .
Comme xobs = 249 , on rejettera donc H0 au niveau α = 0.05 .
Conclusion : chacun des deux tests conduit au rejet de H0 . Ceci ne veut pas
dire que ce rejet soit significatif au sens commun du terme. On peut reprocher au
producteur une certaine “mesquinerie” qui consiste à remplir les boı̂tes un petit peu
moins (1 gr par échantillon) que le poids annoncé. Mais, malgré la significativité
statistique, il serait difficile de crier à la fraude.
2. On veut tester l’hypothèse qu’en Belgique, les filles représentent environ 52 % des
naissances pour 48 % de garçons. Formellement, si p représente la proportion de filles,
nous écrirons H0 : p = 0.52 et HA : p 6= 0.52 . Imaginons que pour dix naissances un
jour donné dans une maternité, on observe une fille.
La p-valeur correspond à la probabilité d’avoir 0 ou 1 “succès” pour dix naissances,
pour une probabilité de “succès” de 0.52 , soit
0
PH0 (X ≤ 1) = C10 0.520 0.4810 + C10
1
0.521 0.489 = 0.00768 .
0.0078 < 0.025. Donc on rejette H0 au niveau α = 0.05 et on conclut que p 6= 0.52.
Chapitre VII
Les tests du chi-carré
1. Fréquences observées – Fréquences théoriques
Comme nous l’avons déjà vu précédemment, les résultats de l’échantillonnage ne cor-

respondent pas toujours aux résultats que laisse prévoir le calcul des probabilités. Par
exemple, si on lance 120 fois un dé équilibré, on s’attend théoriquement à obtenir 20 fois
le chiffre 1 , 20 fois le chiffre 2 , . . . , 20 fois le chiffre 6 .
Ces effectifs, que nous appellerons effectifs théoriques , peuvent être présentés
sous la forme d’un tableau :
Résultat 1 2 3 4 5 6
Effectifs théoriques 20 20 20 20 20 20
Tableau VII.1 –.
Notons Ei l’événement on obtient le chiffre i et ti l’effectif correspondant. Le

Tableau VII.1 prendra la forme générale
Résultat E1 E2 E3 E4 E5 E6
Effectifs théoriques t1 t2 t3 t4 t5 t6
Tableau VII.2 –.
Dans la pratique, il est rare que l’on obtienne exactement ces résultats.
§ VII. Les tests du khi-deux
Supposons que l’on obtienne les effectifs suivants, appelés effectifs observés et
notés Oi , que nous présentons directement dans les Tableaux VII.3 et VII.4.
Résultat 1 2 3 4 5 6
Effectifs observés 14 16 28 30 18 14
Tableau VII.3 –.
Résultat E1 E2 E3 E4 E5 E6
Effectifs observés O1 O2 O3 O4 O5 O6
Tableau VII.4 –.
Les effectifs observés (Tableau VII.3) diffèrent-ils significativement des effectifs théoriques
(Tableau VII.1) ? Doit-on conclure que le dé n’est pas équilibré? Nous allons répondre à
cette question en utilisant un test d’hypothèses.
2. Test du khi-deux d’ajustement
a) Le test
On considère une population de N individus partagés en k catégories E1 , · · · , Ek .
Posons pi = P (Ei ) (i = 1, · · · , k) .
On veut tester l’hypothèse
H0 : p1 = p10 et ··· et pk = pk0
contre l’alternative
H1 : p1 6= p10 ou ··· ou pk 6= pk0

P
k
où les valeurs pi0 sont telles que pi0 = 1 .
i=1
b) La statistique du test
Pour effectuer ce test, considérons un E.A.S. de taille n.

Notons ni l’effectif observé associé à la catégorie Ei (i = 1, · · · ,k) .
L’effectif théorique correspondant (en supposant H0 vérifiée) est donné par ti = npi0 .
Nous allons devoir trouver une statistique à partir de laquelle nous pourrons réaliser
notre test d’hypothèses, et qui nous donnera une mesure globale de la déviation des
effectifs observés par rapport aux effectifs théoriques.
La première statistique qui nous vient à l’esprit pour mesurer globalement la déviation
entre les effectifs observés et les effectifs théoriques, est
k
X k
X
(Oi − ti ) = (ni − npi0 ).
i=1 i=1
Malheureusement cette somme est toujours nulle.
Nous considérerons plutôt la statistique suivante, appelée statistique du khi-deux

(ou chi-carré), que nous noterons χ2 :
Xk Xk
2 (Oi − ti )2 (ni − npi0 )2
χ = = .
i=1
ti i=1
npi0
– Si χ2 = 0 , les effectifs observés sont égaux aux effectifs théoriques;

– Si χ2 > 0 , les deux distributions sont différentes;
– Plus la valeur de χ2 est grande, plus la différence entre les deux distributions
est grande.
χ2 mesure la distance entre le tableau observé (ni ) et le tableau théorique obtenu

sous l’hypothèse H0 .
Distribution de la statistique du test
Si n ≥ 30 et ni ≥ 5 , ∀i , alors on peut montrer que, si H0 est vraie,

k
X k
X
(Oi − ti )2 (ni − npi0 )2
χ2 = = ≈ χ2k−1 .
i=1
ti i=1
npi0
Nous noterons alors cette V.A. χ2k−1 .

c) Règle de décision
- Région critique
On rejette H0 , au niveau α, si la valeur observée de la variable aléatoire

χ2k−1 , notée χ2obs , est telle que χ2obs ≥ kα où kα est tel que
P (χ2k−1 ≥ kα ) = α
On a
P (χ2k−1 ≥ kα ) = α ⇔ P (χ2k−1 < kα ) = 1 − α ⇔ kα = χ2k−1,1−α
où χ2k−1,1−α est le quantile d’ordre k − 1 de la variable aléatoire chi-carré à

n − 1 degrés de liberté.
La région critique est donnée par W = {(n1 , · · · ,nk ) : χ2obs ≥ χ2k−1,1−α } .
- p-valeur
On rejette H0 , au niveau α , si P (χ2k−1 ≥ χ2obs ) ≤ α.
d) Application à notre exemple
1 1 1
H0 : p1 = 6
, p2 = 6
, . . . , p6 = 6
,
1 1 1
H1 : p1 6= 6
, ou p2 6= 6
, ou . . . , ou p6 6= 6
,
X6 6
(Oi − ti )2 X (ni − n pi0 )2
χ25 = = ,
i=1
t i i=1
n p i0
(14 − 20)2 (16 − 20)2 (28 − 20)2 (30 − 20)2 (18 − 20)2 (14 − 20)2
χ2obs = + + + + +
20 20 20 20 20 20
= 12.8 .
- Calcul de la région critique
χ2k−1,1−α = χ25,0.95 = 11.1

Comme χ2obs = 12.8 > χ25,0.95 , on rejette H0 au niveau α = 0.05 .
- Calcul de la p-valeur
PH0 (χ25 ≥ 12.8) = 1 − PH0 (χ25 ≤ 12.8) = 1 − 0.975 = 0.025 < 0.05
On rejette donc H0 au niveau α = 0.05 .
Si le dé est équilibré ( H0 vraie), en moyenne seulement 2.5% des échantillons

de taille 120 conduiront à une valeur de χ25 supérieure ou égale à 12.8 , ce qui
est relativement peu.
On conclut donc, au niveau α = 0.05 , que le dé n’est pas équilibré.
Remarque : quelle conclusion aurions-nous tiré si nous avions choisi le niveau α =

0.01?
Le nombre de degrés de liberté, que nous noterons d , est déterminé de la manière

suivante :
d=k−1
où k est le nombre de cases , ou d’événements intervenant dans le Tableau VII.1.
Remarques :
1. Si, pour calculer les effectifs théoriques, on doit estimer m paramètres de la popula-
tion à partir de statistiques d’échantillonnage, le nombre de degrés de liberté sera
d=k−1−m.
P
6
(Oi −ti )2
2. ti
aura approximativement une distribution chi-carré si tous les effectifs
i=1
théoriques sont au moins égaux à cinq (ce qui est le cas dans notre exemple).
3. On a toujours
k
X k
X
Oi = ti = n
i=1 i=1
où n est le nombre total d’observations.
3. Ajustement à une distribution binomiale
Soient Y une variable aléatoire binomiale de paramètres k et p :
Y ∼ Bi(k,p) ,
et les événements
A0 = {Y = 0} , A1 = {Y = 1} , · · · , Ak = {Y = k} .
Le problème qui se pose n’est pas d’effectuer un test sur le paramètre p , mais d’examiner
si la distribution binomiale dans son entièreté s’applique au phénomène étudié.
Voici un exemple simple : on s’intéresse au nombre Y de garçons dans une famille de

cinq enfants, et on suppose que Y est une variable aléatoire Bi(5,p) . Il se peut cependant
que certaines conditions posées dans le modèle de la distribution binomiale soient violées;
on peut mettre en doute, par exemple, l’indépendance des naissances successives, ce qui
aurait comme conséquence que la proportion réelle de familles de cinq garçons est plus
élevée que celle prévue par distribution binomiale.
Les hypothèses qu’on se propose d’étudier sont :

H0 : le nombre de garçons dans les familles de cinq enfants est une va-
riable aléatoire binomiale;
H1 : le nombre de garçons dans les familles de cinq enfants n’est pas une
variable aléatoire binomiale.
L’expérience consiste à examiner n familles de cinq enfants, et à noter le nombre

O0 ,O1 , · · · ,O5 de familles ayant 0,1, · · · ,5 garçons.
Les effectifs théoriques sont donnés par la distribution binomiale
t0 = n p0 = n C50 p0 q 5 ,
t1 = n p1 = n C51 p1 q 4 ,
..
.
t5 = n p5 = n C55 p5 q 0 ,
où p0 = P (Y = 0) , p1 = P (Y = 1) ,. . . , p5 = P (Y = 5) .
La statistique à calculer pour éprouver H0 est
Xk
(Oi − ti )2
χ2k−1 =
i=0
ti
avec (k − 1) degrés de liberté si p est connu.

Exemple : l’examen de 320 familles de 5 enfants s’est traduit par la distribution du

Tableau VII.5, où Y désigne le nombre de garçons.
Le nombre de garçons est-il distribué suivant une distribution binomiale de paramètre
p = 12 ?
Résultat (nombre de garçons) 0 1 2 3 4 5
Effectifs observés Oi 8 40 88 110 56 18
Tableau VII.5 –.
Solution :
– Calculons les effectifs théoriques
Y est la variable aléatoire : nombre de garçons dans une famille de 5 enfants.

Sous H0 , Y ∼ Bi 5, 21 . Par conséquent,

1 0

1 5
PH0 (Y = 0) = C50 2 2
= 1
32

1 5
PH0 (Y = 1) = C51 2
= 5
32

1 5
PH0 (Y = 2) = C52 2
= 10
32

1 5
PH0 (Y = 3) = C53 2
= 10
32

1 5
PH0 (Y = 4) = C54 2
= 5
32

1 5
PH0 (Y = 5) = C55 2
= 1
32
·
Les effectifs théoriques sont donnés par
ti = 320 × PH0 (Y = i) .
Nous obtenons le tableau suivant :
– Calculons la statistique du χ2
Résultat (nombre de garçons) 0 1 2 3 4 5
Effectifs théoriques ti 10 50 100 100 50 10
Tableau VII.6 –.
X5
(Oi − ti )2
χ25 =
i=0
ti
(8 − 10)2 (40 − 50)2 (88 − 100)2 (110 − 100)2

χ2obs = + + +
10 50 100 100
(56 − 50)2 (18 − 10)2

+ +
50 10
= 12 .
– Effectuons le test
1) Calcul de la p-valeur:
PH0 (χ25 ≥ 12) = 1 − PH0 (χ25 ≤ 12) < 0.05 .

2) Calcul de la région critique :
On rejette H0 , au niveau α = 0.05 , si χ2obs ≥ χ26−1,0.95 .
On trouve, dans les tables : χ25,0.95 = 11.1 < 12 .
On rejette H0 au niveau α = 0.05 ; on a un risque de se tromper de 5% maximum.
4. Test du khi-deux d’indépendance entre deux

variables
a) Le test
Supposons que dans une population chaque individu possède deux caractères Y et
X dont les modalités respectives sont A1 , · · · ,Ar et B1 , · · · ,Bs .
Ces caractères peuvent-ils être considérés comme statistiquement indépendants?
On testera donc les hypothèses
H0 : les variables X et Y sont indépendantes

H1 : les variables X et Y ne sont pas indépendantes
b) Statistique du test
Appelons nij le nombre d’individus possédant la modalité Ai du caractère Y et la

modalité Bj du caractère X .
Les variables X et Y sont indépendantes
ssi ∀i,j : fij = fi• f•j
ni• n•j
ou encore ssi ∀i,j : nij = .
n
On souhaite obtenir une statistique qui mesure la distance entre le tableau observé
et le tableau théorique (obtenu sous l’hypothèse H0 que les variables X et Y
sont indépendantes).
On peut montrer que, sous H0 ,

Xr X s r s n n
2 (Oij − tij )2 X X (nij − i•n •j )2
χ = = ni• n•j ≈ χ2(r−1)(s−1)
i=1 j=1
tij i=1 j=1 n
c) Règle de décision
- Région critique
On rejette H0 , au niveau α , si χ2obs ≥ χ2(r−1)(s−1),1−α .
On a alors W = {(n11 , · · · ,nrs ) : χ2obs ≥ χ2(r−1)(s−1),1−α } .
- p-valeur
On rejette H0 , au niveau α ,
si P (χ2(r−1)(s−1) ≥ χ2obs ) ≤ α.
d) Exemple 1
Le tableau ci-dessous reprend la répartition des électeurs d’une ville, en fonction

de leur opinion politique d’une part (Parti A, Parti B) , et du niveau de leur
salaire d’autre part (élevé, moyen, faible).
Salaire
élevé moyen faible
Parti A 15 35 10 60
Parti B 5 15 20 40
20 50 30 100
Question : les variables X (niveau de salaire) et Y (opinion politique) sont-elles

indépendantes? Nous aurons donc les hypothèses suivantes :
H0 : les variables X et Y sont indépendantes,
H1 : les variables X et Y ne sont pas indépendantes.
Le Tableau ci-dessus nous est familier. Il s’agit d’un tableau de contingence. La

variable qualitative X a trois modalités ; la variable Y a deux modalités.
- Le tableau de contingence obtenu sous l’hypothèse d’indépendance (tableau

théorique) est
Niveau
élevé moyen faible
Parti A 12 30 18 60
Parti B 8 20 12 40
20 50 30 100
Par exemple,
n1• n•1 60 × 20
n011 = = = 12 ,
n 100
n1• n•2 60 × 50
n012 = = = 30 ,
n 100
..
.
- Calculons la statistique du chi-carré :
(15−12)2 (35−30)2 (10−18)2 (5−8)2 (15−20)2 (20−12)2

χ2obs = 12
+ 30
+ 18
+ 8
+ 20
+ 12
= 12.85.
Le nombre de degrés de liberté est égal à: (r-1)(s-1)= (2-1)(3-1) = 2.
- Calcul de la région critique : χ22,0.95 = 5.99 .
Puisque χ2obs > χ22,0.95 , il y a rejet de H0 .

Au niveau 0.05 , on conclut que les variables X et Y ne sont pas indépendantes.
- Calcul de la p-valeur: PH0 (χ25 ≥ 12.85) = 1 − PH0 (χ25 ≤ 12.85) < 0.05 .
Conclusion
Au niveau α = 0.05 , il y a association entre les variables opinion politique et

niveau de revenu .
Exemple 2 : afin de déterminer s’il y a indépendance entre le groupe sanguin et le

sexe, on a examiné 976 individus prélevés au hasard. Les observations se répartissent
comme suit :
Les hypothèses sont :

H0 : il y a indépendance entre le sexe et le groupe sanguin,
H1 : il n’y a pas d’indépendance entre le sexe et le groupe sanguin.

Sexe
Groupe sanguin Hommes Femmes Total
AB 25 15 40
A 215 207 422
O 200 194 394
B 60 60 120
Total 500 476 976
Tableau VII.7 –. Effectifs de 976 individus classés par sexe et par groupe sanguin.
Étant donné H0 , on peut calculer les effectifs théoriques.

Par exemple,
n1• n•1 40 × 50
n011 = = ' 20.49 ,
n 976
n1• n•2 422 × 500
n012 = = ' 216.19 ,
n 976
..
.
En procédant de même pour tous les cas, on obtient la table des effectifs théoriques :
Sexe
Groupe sanguin Hommes Femmes Total
AB 20.49 19.51 40
A 216.19 205.81 422
O 201.84 192.16 394
B 61.48 58.52 120
Total 500 476 976
Tableau VII.8 –. Effectifs de 976 individus classés par sexe et par groupe sanguin.
On calcule alors la valeur de la statistique χ2 :
(25 − 20.49)2 (60 − 58.52)2

χ2obs = +···+ = 2.154 ,
20.49 58.52
et le nombre de degrés de liberté :
(r − 1)(s − 1) = (4 − 1)(2 − 1) = 3 .
– Calcul de la région critique :

La table de χ2 donne, pour α = 0.05 et degré de liberté =3 :
χ23,0.95 = 7.81 .
Puisque χ2obs < χ23,0.95 , il y a non rejet de H0 .
– Calcul de la p-valeur :
PH0 (χ23 ≥ 2.154) = 1 − PH0 (χ23 ≤ 2.154) > 0.05 .
On ne rejette donc pas H0 au niveau de signification α = 0.05 .
En conclusion, ces observations ne permettent pas d’affirmer qu’il y a association

entre le groupe sanguin et le sexe.
Statistique I
Syllabus d’exercices
Partie II
Chapitre V
Échantillonnage – Distributions
d’échantillonnage
1. Exercices résolus
Exercice 1
Une population est caractérisée par une moyenne égale à 200 et un écart type égal à 50 .
Supposons qu’un échantillon aléatoire simple de taille 100 soit sélectionné et que x soit
utilisé comme estimation de µ .
Quelle est la probabilité que la moyenne d’échantillonnage s’écarte au plus de ±5 de la
moyenne de la population?
Solution : par le théorème central limite :

2 500
X ≈ N 200, .
100
D’où
p = P (|X − µ| ≤ 5)
= P (µ − 5 ≤ X ≤ µ + 5)
= P (195 ≤ X ≤ 205)
= P (X ≤ 205) − P (X ≤ 195) ,
§ V. Échantillonnage – Distributions d’échantillonnage

205 − 200
P (X ≤ 205) = P Z≤ = P (Z ≤ 1)
5
= 0.8413 ,

195 − 200
P (X ≤ 195) = P Z ≤ = P (Z ≤ −1)
5
= P (Z ≥ 1) = 1 − P (Z ≤ 1)
= 0.1587 ,
p = 0.8413 − 0.1587 = 0.6826 .
Exercice 2
L’Institut National de Statistique révèle, sur base du dernier recensement, que 17% des
ménages dépensent plus de 100 Euros par semaine en épicerie.
On extrait de la population un échantillon aléatoire simple de 800 ménages.
(a) Quelle est la distribution d’échantillonnage de p̂, la proportion des ménages de

l’échantillon qui dépensent plus de 100 Euros par semaine en épicerie?
(b) Quelle est la probabilité pour que la proportion d’échantillonnage s’écarte de ±0.02
de la proportion de la population?
Solution :
(a) Soit X le nombre de ménages dans l’échantillon qui dépensent plus de 100 Euros en
épicerie.
X p(1 − p)
p̂ = , E(p̂) = p , var(p̂) = ,
n n
d’où
E(p̂) = 0.17 ,
(0.17) (0.83)
var(p̂) = = 0.0001763 ,
800
p
σp̂ = var(p̂) = 0.0133 .
(b) p̂ suit une distribution Normale car
n p = 800 × 0.17 = 136 > 5 ,

n (1 − p) = 800 × 0.83 = 664 > 5 ,

d’où

0.15 − 0.17 0.19 − 0.17
P (0.15 ≤ p̂ ≤ 0.19) = P ≤Z≤
0.0133 0.0133
= P (−1.50 ≤ Z ≤ 1.50)
= P (Z ≤ 1.50) − P (Z ≤ −1.50)
= P (Z ≤ 1.50) − [1 − P (Z ≤ 1.50)]
= 0.86638 .
2. Exercices supplémentaires
1. La distribution d’échantillonnage de la moyenne : faire une synthèse des différents
cas vus au cours.
2. Certains tubes fabriqués par une compagnie ont une durée de vie moyenne de 800
heures et un écart type de 60 heures. On suppose que la durée de vie de ces tubes
suit une distribution Normale.
(a) Calculer la probabilité qu’un tube pris au hasard ait une durée de vie moyenne
comprise entre 790 et 810 heures.
(b) Calculer la probabilité qu’un échantillon de 36 tubes pris au hasard dans la
population ait une durée de vie moyenne comprise entre 790 et 810 heures.
(c) Comparer et expliquer les résultats obtenus dans les deux points précédents.
3. Les poids des colis reçus dans un grand magasin ont une moyenne de 300 kg et un
écart type de 50 kg. Quelle est la probabilité pour que 25 colis reçus au hasard et
chargés sur un monte-charge dépassent la limite de sécurité du monte-charge, qui est
de 8 200 kg?
4. Soit T une V.A. de Student à 15 degrés de liberté.

Calculer
(a) P (T ≤ 2.15)
(b) P (T = 2.15)
(c) P (T ≤ 1.75)
(d) P (T ≥ 0)
(e) P (T > 1.75)
Représenter chacune des aires concernées sur un graphique.
5. (a) Donner la définition du quantile d’ordre α de la distribution de Student à n

degrés de liberté, et en donner une représentation graphique.
(b) Calculer le quantile d’ordre 0.95 d’une distribution de Student à 10 degrés de
libertés.
(c) Calculer le quantile d’ordre 0.05 d’une distribution de Student à 10 degrés de
libertés.
(d) Conclure.
6. Calculer le quantile d’ordre 0.975
(a) d’une distribution Normale centrée réduite.

(b) d’une distribution de Student à n degrés de liberté lorsque
i. n = 20 .
ii. n = 30 .
iii. n = 500 .
iv. n augmente indéfiniment.
(c) conclure.
Chapitre VI
Intervalles de confiance
Exercice 1
Un échantillon de 532 abonnés à Trends Tendances a révélé qu’un abonné passait, en
moyenne, 6.7 heures par semaine à consulter Internet et les services en ligne, avec un écart
type s0 égal à 5.8 heures.
Calculer un intervalle de confiance à 95% par le temps passé en moyenne par les abonnés
de Trends Tendances à utiliser Internet et les services en ligne.
Solution :
• Population : les abonnés à Trends Tendances.

V.A. associée à la population : X temps passé par les abonnés à consulter Internet
et les services en ligne.
Paramètre sur lequel porte l’inférence : E(X) = µ .
• Échantillon : 532 abonnés à Trends Tendances
x = 6.7heures , s0 = 5.8heures .
§ VI. Intervalles de confiance
• Calcul de l’intervalle :
Il s’agit d’un intervalle de confiance pour la moyenne d’une population quelconque,

de variance inconnue, dans le cas de grands échantillons :

s0 s0
Iα (µ) ≈ X − z1− 2 √ , X + z1− 2 √
α α
n n

5.8 5.8
I0.05 (µ) = 6.7 − 1.96 √ , 6.7 + 1.96 √
532 532
= [6.207,7.193]
Interprétation : si on prélève de la population des lecteurs de Trends Ten-

dances un très grand nombre d’échantillons de taille 532 , environ 95% d’entre eux
recouvriront la vraie valeur inconnue du paramètre µ .
Exercice 2
Lors d’un sondage Time/CNN, 814 adultes ont répondu à une série de questions sur leur
opinion quant à l’état des affaires aux États-Unis. Au total, 532 adultes ont répondu
OUI à la question :
Pensez-vous que les choses aillent bien aux États-Unis en ce moment?
(Time, 11 août 1997)
(a) Quelle est l’estimation ponctuelle de la proportion de la population d’adultes qui

pensent que les choses vont bien aux États-Unis?
(b) Au seuil de confiance de 90%, quelle est la marge d’erreur?
(c) Calculer l’intervalle de confiance à 90% pour la proportion de la population des
adultes qui pensent que les choses vont bien aux États-Unis?
Solution :
(a) Soit X la V.A. comptant le nombre d’adultes d’un échantillon de 814 adultes qui
pensent que les choses vont bien aux Etats-Unis.
X
Soit p̂ = n
.
532
Alors p̂ = = 0.6904 .
814
(b) On peut supposer que X ∼ Bi (n,p).

Or n ≥ 30. Donc X peut être approchée par une loi N (np,npq).
Donc p̂ peut être approchée par une loi N (p, pq
n
p̂−p
) et √ p.q peut être approchée par une
n
loi N (0,1).
Ainsi la marge d’erreur, c’est-à-dire la demi-longueur de l’intervalle de confiance, sera
donnée par
r
p̂ q̂
E = z1− α2
n
q
= 1.645 0.6904 (1−0.6904)
814
= 0.0267 .
q
p̂ q̂
(c) Iα (p) = X̄ ± z1− α2 n
I0.1 (p) = 0.6904 ± 0.0267
= [0.6637,0.7171] .
1. Les intervalles de confiance pour le paramètre µ d’une distribution Normale et pour
une proportion : faire une synthèse des différents cas vus au cours.
2. Le taux moyen de cholestérol mesuré sur un échantillon de 144 sujets choisis par
tirage au sort dans une population d’individus âgés de plus de cinquante ans est de
1985 cg . On suppose l’écart type de la mesure du taux de cholestérol connu dans
cette population, et égal à 50 cg .
(a) Donner une estimation par intervalle de confiance de la moyenne exacte du

taux de cholestérol dans cette population (prendre un niveau d’incertitude égal
à 0.05).
(b) Donner une interprétation de cet intervalle de confiance.
(c) Si le niveau d’incertitude avait été de 0.01 , l’intervalle de confiance aurait-il été
plus grand ou plus petit? Expliquer.
3. La moyenne des poids d’un échantillon représentatif de 100 étudiants des Facultés
Universitaires est de 67.45 kg avec un écart-type s0 égal à 2.93 kg .
(a) Identifier la population concernée, ainsi que la variable aléatoire associée à cette
population.
(b) Déterminer un intervalle de confiance à 95 % pour estimer le poids moyen des
étudiants des Facultés Universitaires .
(c) Donner une interprétation de cet intervalle de confiance.
4. Une enquête a été faite en Belgique auprès d’un échantillon représentatif de 50 per-
sonnes de manière à avoir leur avis sur un projet du Gouvernement concernant l’envi-
ronnement. On constate que dans cet échantillon, 25 % des personnes sont favorables
à ce projet.
(a) Déterminer un intervalle de confiance pour la proportion de personnes favorables

à ce projet dans toute la population (prendre un niveau d’incertitude de 5 %).
(b) Donner une interprétation de cet intervalle de confiance.
5. Sur 100 dossiers pris au hasard dans un service de désintoxication pour fumeurs, on
relève que 35 personnes, après avoir suivi volontairement le traitement jusqu’au bout,
déclarent n’avoir pas récidivé.
(a) Donner une estimation de la proportion p de fumeurs de ce service de désintoxication

qui déclarent n’avoir pas récidivé.
(b) Trouver un intervalle de confiance pour p .
(c) Que peut-on déduire sur l’efficacité d’un tel traitement (on prendra un niveau
d’incertitude égal à 0.05).
6. Dans un échantillon aléatoire simple de 2 424 naissances, on a trouvé 1 270 garçons

et 1 154 filles.
(a) Donner une estimation du pourcentage de garçons à la naissance dans la popu-

lation.
(b) Donner un intervalle de confiance de ce pourcentage aux niveaux d’incertitude
de 5 pourcents et de 1 pourcent. Comparer les intervalles obtenus.
(c) Combien de naissances doit-on recenser pour connaı̂tre le pourcentage de garçons
dans la population, avec une précision égale à 0.05 pourcents, au niveau d’in-
certitude de 5 pourcents.
7. Un institut de sondage a observé sur un échantillon de 1 600 personnes, 51 pourcents

d’intentions de vote en faveur du candidat X .
Peut-on assurer, avec un risque 5 pourcents de se tromper, que le candidat X sera
élu?
8. Un mareyeur livre des caisses de thon blanc à la conserverie. À la réception des colis,
le responsable a des doutes sur le poids affiché ; il prélève un échantillon de 16 caisses
dont il mesure en tonnes la moyenne et l’écart type : x̄ = 1.98 t ; s0 = 0.11 t .
Trouver un intervalle de confiance à 95 pourcents pour le poids moyen de ces caisses.
Sachant que le poids affiché est de 2 t , le mareyeur tient-il ses engagements?
(On suppose que le poids des caisses suit une distribution Normale.)
9. Supposons que la moyenne x̄ d’un échantillon aléatoire simple d’effectif 25, prélevé
dans une population N (µ, 6400) vaille 81.2 . Trouver un intervalle de confiance
pour µ au niveau de confiance 0.95 .
10. On suppose que le temps de mémorisation d’un texte par les étudiants d’une promo-
tion suit une distribution Normale. Un échantillon de 17 étudiants fournit les valeurs
observées suivantes : x̄ = 25 , s0 = 5 .
Trouver un intervalle de confiance pour le temps moyen de mémorisation µ de la
promotion.
11. Pour étudier un lot de fabrication de comprimés, on en prélève 10 au

hasard que l’on pèse. On obtient les résultats suivants (en centigrammes) :
81 84 83 80 85 86 85 83 84 80
On admet que le poids d’un comprimé suit une distribution Normale.
(a) Trouver un intervalle de confiance, au niveau d’incertitude 0.05 , pour la moyenne

du poids des comprimés du lot de fabrication considéré.
(b) Donner une interprétation de cet intervalle de confiance?
12. La durée d’écoulement d’un grand sablier est une variable aléatoire N (µ,σ 2 ) dont on
ne connaı̂t pas les paramètres. En le faisant fonctionner 10 fois, on obtient une durée
moyenne x̄ égale à 16 secondes, avec un écart-type s0 égal à 1 seconde.
(a) Donner une estimation ponctuelle du temps d’écoulement moyen du sablier.

(b) Calculer un intervalle de confiance, au niveau d’incertitude 0.05 , pour le temps

d’écoulement moyen du sablier.
(c) Calculer un intervalle de confiance, au niveau d’incertitude 0.01 , pour le temps
d’écoulement moyen du sablier.
(d) Comparer les deux intervalles trouvés aux deux points précédents.
(e) Si on prenait un niveau d’incertitude égal à 0.1 , l’intervalle de confiance ob-
tenu serait-il plus petit ou plus grand que les intervalles trouvés ci-dessous ?
Expliquer.
(f) Supposons que l’on fasse fonctionner le sablier 20 fois, et que l’on obtienne
la même moyenne x̄ et le même écart-type s0 . Si on calcule un intervalle de
confiance au niveau d’incertitude 0.05 pour le temps d’écoulement moyen du
sablier, cet intervalle sera-t-il plus petit ou plus grand que l’intervalle trouvé au
point (b)? Expliquer.
Chapitre VI
Tests d’hypothèses
1. Exercice résolu
En février 2000, le prix moyen d’un voyage aller-retour par avion en Europe était de 258
Euros. Un échantillon aléatoire simple de 15 billets aller-retour par avion en Europe, vendus
au cours du mois de février 2001, a fourni les données suivantes sur les prix :
310 260 265 255 300 310 230 250 265 280 290 240 285 250 260
En utilisant un niveau de 5% , tester si le prix moyen d’un billet d’avion aller-retour

en Europe a augmenté de février 2000 à février 2001 (on suppose que le prix des billets
aller-retour par avion en Europe suit une distribution Normale).
Solution :
• Population : prix des voyages en avion aller-retour en Europe en février 2001.

V.A. Associée à la population : X , prix d’un voyage en avion aller-retour en
Europe en février 2001.
X ∼ N (µ,σ 2 ) .
• Échantillon : 15 prix de billets d’avion aller-retour en Europe en février 2001.

P
xi
xobs = = 270 ,
n
rP
0 (xi − x)2
s = = 24.78 .
n−1
§ VI. Tests d’hypothèses
• Test :
(a) H0 : µ = 258 ,
H1 : µ > 258 .
(b) Statistique du test : X .
Sous H0 :
X − µ0
s0
∼ tn−1 .
√
n
En effet, l’écart type σ est inconnu et n < 30.

(c) Règle de décision :
1. Région critique : on rejette H0 , au niveau α , si
s0
xobs ≥ µ0 + tn−1,1−α √ ;
n
on a :
xobs = 270 ,
s0 24.78
µ0 + tn−1,1−α √ = 258 + 1.761 √ = 269.3
n 15
Conclusion : xobs > 269.3; on rejette donc H0 au niveau α = 0.05 .
Le prix des billets d’avion aller-retour en Europe a augmenté de février 2000
à février 2001.
2. p-valeur : on rejette H0 , au niveau α , si p-valeur ≤ α :
!
X − µ0 270 − 258
PH0 (X ≥ xobs ) = PH0 s0
≥ 24.78
√ √
n 15
= PH0 (t14 ≥ 1.88)

= 1 − PH0 (t14 ≤ 1.88) < 0.05 .
car PH0 (t14 ≤ 1.88) > 0.95.
Conclusion : on rejette H0 au niveau α = 0.05 .

Le prix des billets d’avion aller-retour en Europe a augmenté.
1. Test sur le paramètre µ d’une distribution Normale de variance σ 2 (connue).
Faire une synthèse des différents cas (alternatives unilatérale à gauche, unilatérale à
droite, bilatérale).
2. Un procédé de fabrication courant a produit des millions de tubes TV, dont la durée
de vie moyenne est de 1 200 heures, avec un écart type de 300 heures .
Un nouveau procédé, estimé meilleur par le bureau d’études, fournit un échantillon
de 100 tubes, avec une moyenne de 1 265 heures. On suppose l’écart type connu, égal
à 300 heures.
Tester l’hypothèse que le nouveau procédé est meilleur (au niveau de 0.05)
(a) en utilisant la région critique.

(b) en utilisant la p-valeur.
3. Un procédé de fabrication courant a produit des millions de tubes TV, dont la durée
de vie moyenne est de 1 200 heures, avec un écart type de 300 heures.
Un nouveau procédé, estimé moins bon par le bureau d’études, fournit un échantillon
de 100 tubes, avec une moyenne de 1 135 heures. On suppose l’écart type connu, égal
à 300 heures.
Tester l’hypothèse que le nouveau procédé est moins bon (au niveau de 0.05)
(a) en utilisant la région critique.

(b) en utilisant la p-valeur.
4. Une bibliothèque universitaire se demande si le nombre moyen d’ouvrages consultés

par les étudiants au cours d’une visite dans cette bibliothèque a augmenté. Dans le
passé une étude avait montré que cette moyenne s’établissait à 3 livres. Un échantillon
de 10 étudiants a permis de mesurer une moyenne de 4.1 livres consultés, avec un
écart type mesuré s0 égal à 1.897 .
On suppose que la variable aléatoire X , qui représente le nombre de livres consultés
par étudiant, suit une distribution Normale.
Au vu de ces résultats, peut-on conclure que le nombre moyen de livres consultés par
les étudiants a augmenté significativement?
Pour répondre à cette question,
(a) prendre un niveau de 1 pourcent et calculer la région critique du test ;

(b) prendre un niveau de 5 pourcents et calculer la p-valeur ;

(c) conclure.
5. Dans une expérience sur l’acuité visuelle, un chercheur a demandé à 49 individus

d’évaluer la distance d’un objet placé à 20 cm . On suppose ici que l’évaluation de
la distance par un individu suit une distribution Normale. Les résultats obtenus à
partir de ces 49 individus fournissent une valeur moyenne de 18.93 cm et un écart
type s0 = 2.82 cm .
(a) Au vu de ces résultats, peut-on conclure, au niveau de 0.01 , que les individus
ont de la difficulté à évaluer la distance d’un objet placé à 20 cm?
(b) Expliquer, d’une manière générale, la démarche effectuée dans le cadre d’un test
d’hypothèses.
6. Une association de consommateurs souhaite savoir si le poids exact du contenu des

boı̂tes de petits pois n’est pas inférieur au poids indiqué sur l’étiquette. Le poids net
égoutté annoncé sur l’étiquette est de 250 g. Sachant que dans ce genre de situation,
l’écart type pour le poids d’une boı̂te est de 2 % du poids, soit 5 g, quelles conclusions
tirer d’un échantillon de 120 boı̂tes donnant une moyenne observée de 249 g?
7. Le fabricant d’un médicament breveté affirmait qu’il était efficace à 90 pourcents

pour guérir une allergie en 8 heures. Dans un échantillon de 200 personnes atteintes
par cette allergie, on en a guéri 160 par le médicament.
Déterminer si l’affirmation du fabricant est légitime, au seuil de 1 pourcent.
Chapitre VII
Tests chi-carré
Exercice 1
On effectue une étude sur le développement de 80 villes dont on a constaté que l’extension
à partir du centre se faisait dans une direction géographique prioritaire. Le tableau suivant
donne, pour chaque direction, le nombre de villes pour lesquelles on a relevé l’extension
dans cette direction :
Direction N NE E SE S SO O NO
Nombre de villes 7 6 4 6 10 16 18 13
(a) On se fixe a priori un niveau α = 0.05 .

Ces données sont-elles compatibles avec l’hypothèse que l’extension d’une ville a les
mêmes chances de se faire dans n’importe quelle direction?
(b) Quel est le risque que l’on rend réellement en rejetant cette hypothèse?
Solution :
(a) Il s’agit d’un test chi-carré d’ajustement.
Soit E1 (respectivement E2 , · · · ,E8 ) l’événement l’extension se fait dans la direc-
tion N (respectivement NE , E , SE , S , SO , O , NO ).
Notons pi = p(Ei ) , i = 1, · · · ,8 .
L’hypothèse nulle exprimera que l’extension d’une ville a les mêmes chances de se
faire dans n’importe quelle direction :
1
H0 : p1 = p 2 = · · · = p 8 = ·
8
§ VII. Tests chi-carré
L’hypothèse alternative sera alors

1 1 1
H1 = p1 6= ou p2 6= ou ··· ou p8 6= .
8 8 8
Les effectifs théoriques (calculés sous l’hypothèse que H0 est vraie) sont tous égaux
à
1
× 80 = 10 .
8
Le tableau théorique sera donné par :
Direction N NE E SE S SO O NO
Nombre de villes 10 10 10 10 10 10 10 10
On calcule la distance entre le tableau théorique et le tableau observé :

8
X (ni − n pi )2
χ2obs =
i=1
n pi
(7 − 10)2 (6 − 10)2 (4 − 10)2 (6 − 10)2

= + + +
10 10 10 10
(10 − 10)2 (16 − 10)2 (18 − 10)2 (13 − 10)2

+ + + +
10 10 10 10
= 18.6 .
Le nombre de degré de liberté est 8−1 =7 .
1. Région critique :
Règle de décision : on rejette H0 , au niveau α = 0.05, si χ2obs ≥ χ27,0.95 .

Les tables donnent : χ27,0.95 = 14.1
χ2obs = 18.6 > 14.1 .
On rejette H0 au niveau α = 0.05 .
Conclusion : l’extension d’une ville n’a pas les mêmes chances de se faire dans
n’importe quelle direction (au niveau α = 0.05 ).
2. p-valeur :
Règle de décision : on rejette H0 , au niveau α , si p-valeur ≤ α .
PH0 (χ27 ≥ χ2obs ) = PH0 (χ27 ≥ 18.6)

= 1 − PH0 (χ27 ≤ 18.6)
≈ 1 − 0.99
≈ 0.01 < α = 0.05 .
On rejette H0 au niveau α = 0.05 .
(b) Le risque que l’on prend réellement en rejetant H0 est donné par la p-valeur. Ce
risque est donc voisin de 1% .
Exercice 2
On compare la qualité des sondages réalisés par deux instituts A et B en testant l’exactitude
de leurs prévisions durant une année. Les résultats sont les suivants :
Institut A Institut B
Nombre de prévisions exactes 83 105
Nombre de prévisions fausses 7 5
a) Formuler une hypothèse à tester et proposer un test.
b) Exécuter le test et conclure (on se fixe un niveau de 0.1 ).
c) Si on prend un niveau plus petit, la conclusion reste-t-elle toujours la même? Expli-

quer (ne pas faire de calculs).
Solution :
a) H0 : l’exactitude des prévisions est indépendante du choix de l’institut ;
H1 : l’exactitude des prévisions dépend du choix de l’institut.
Il s’agit d’un test chi-carré d’indépendance.

b) Le tableau observé est donné dans l’énoncé. On le complète en y indiquant les effectifs
marginaux :
Nombre de prévisions exactes 83 (n11 ) 105 (n12 ) 188 (n1• )
Nombre de prévisions fausses 7 (n21 ) 5 (n22 ) 12 (n2• )
90 (n•1 ) 110 (n•2 ) 200 (n)
Les effectifs théoriques n0ij sont calculés sous l’hypothèse que H0 est vraie (hypothèse
d’indépendance) :
n1• × n•1 188 × 90
n011 = = = 84.6 ,
n 200
n1• × n•2 188 × 110
n012 = = = 103.4 ,
n 200
n2• × n•1 12 × 90
n021 = = = 5.4 ,
n 200
n2• × n•2 12 × 110
n022 = = = 6.6 .
n 200
Le tableau théorique est donné par :
Nombre de prévisions exactes 84.6 103.4 188
Nombre de prévisions fausses 5.4 6.6 12
90 110 200
La distance entre le tableau théorique et le tableau observé est donnée par :

2 X 2
X (nij − n0ij )2
χ2obs =
i=1 j=1
n0ij
(83 − 84.6)2 (105 − 103.4)2 (7 − 5.4)2 (5 − 6.6)2

= + + +
84.6 103.4 5.4 6.6
= 0.917 .
Le nombre de degrés de liberté est 1 .
(a) Région critique :
Règle de décision : on rejette H0 , au niveau de 0.1 , si χ2obs > χ21,0.9 .

Les tables donnent :
χ21,0.9 = 2.71
et
χ2obs = 0.917 < 2.71 .
Conclusion : l’hypothèse n’est pas rejetée au niveau α = 0.1 .

Il y a donc indépendance entre l’exactitude des prévisions et le choix de l’institut.
Ici, le χ2obs est très petit. La différence de résultats entre les deux instituts n’est
pas du tout significative.
(b) p-valeur :
Règle de décision : on rejette H0 , au niveau α , si la p-valeur est inférieure à α .

On a
PH0 (χ21 ≥ χ2obs ) = PH0 (χ21 ≥ 0.917)

= 1 − PH0 (χ21 < 0.917) .
Conclusion : La p-valeur est comprise entre 0.3 et 0.4, donc supérieure à α = 0.1.
On ne rejette pas H0 au niveau α = 0.1 .
c) Plus le niveau du test est petit, moins facilement on rejette H0 . Comme on ne rejette
pas H0 au niveau α = 0.1, a fortiori on ne rejettera pas H0 à un niveau α plus petit.
1. Soit X une V.A. chi-carré à 6 degrés de liberté. Calculer
(a) P (X ≤ 12.6)
(b) P (X ≥ 16.8)
(c) le quantile d’ordre 0.95 de la distribution de X
(d) le quantile d’ordre 0.99 de la distribution de X
2. Lors d’un sondage, les avis donnés par 404 électeurs sur les partis de la majorité et
de l’opposition sont repris dans le tableau suivant :
Favorables Opposés Indécis

Majorité 85 78 37
Opposition 118 61 25
Tester, au niveau de 0.05 , l’hypothèse nulle suivant laquelle il n’y a aucune différence
entre la popularité des partis de la majorité et la popularité des partis de l’opposition.
3. Dans une étude pour ses annonceurs, un groupe de presse a tiré au hasard un
échantillon de 100 lecteurs de chacun de ses trois principaux titres, avec les résultats
suivants :
Journal
Classe sociale A B C
Bas revenus 29 9 10
Petite bourgeoisie 47 57 49
Moyenne bourgeoisie 16 24 29
Grande bourgeoisie 8 10 12
Tester, au niveau 0.05 , l’hypothèse nulle suivant laquelle le choix d’un journal est
indépendant de la classe sociale des lecteurs.
4. Au départ d’une course de chevaux, il y a habituellement 8 positions, et la position

numéro 1 est la plus proche de la palissade intérieure. On pense qu’un cheval a plus
de chances de gagner quand il porte un numéro faible (c’est-à-dire qu’il est proche
de la palissade intérieure).
Les données de 144 courses sont présentées dans le tableau suivant :
Position de départ (numéro) 1 2 3 4 5 6 7 8

Nombre de victoires d’un cheval
29 19 18 25 17 10 15 11
ayant ce numéro
(a) Tester l’hypothèse suivant laquelle le nombre de victoires est le même, quelle
que soit la position de départ (prendre un niveau de 0.05 ).
(b) En vous servant de cet exemple, donner une interprétation du niveau de ce test.
5. Le tableau suivant reprend des données concernant le niveau des dépenses pour
l’achat de produits cosmétiques observées sur un échantillon de 500 femmes adultes
différentiées par leur statut professionnel.
Statut professionnel
Travail à Travail à
Dépenses par mois Sans profession
temps plein temps partiel
Moins de 500 Euros 30 20 60
Entre 500 et 1 000 Euros 55 60 65
Plus de 1 000 Euros 55 80 75
(a) Tester, au niveau de 5 pourcents, l’hypothèse nulle suivant laquelle le niveau

des dépenses est indépendant du statut professionnel des femmes.
(b) En vous servant de cet exemple, donner une interprétation du niveau de ce test.
(c) Si on avait pris un niveau de 1 pourcent, aurait-on rejeté plus facilement ou
moins facilement l’hypothèse nulle? Expliquer.
6. Parmi un groupe de malades qui se plaignent de ne pas bien dormir, certains ont
absorbé un somnifère sous la forme de cachets, d’autres ont absorbé des cachets de
sucre (tous pensaient qu’on leur administrait un somnifère). Après quoi on leur a
demandé si les cachets ont été efficaces. Le tableau suivant indique les différentes
réponses. Tester l’hypothèse qu’il n’y a aucune différence entre le somnifère et le
sucre au seuil de 0.05 .
ont bien dormi n’ont pas bien dormi

ont pris le somnifère 44 10
ont pris du sucre 81 35

Syllabus Math Stat 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Syllabus Math Stat 2

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre V

À partir de l’observation d’un sous-ensemble d’individus de cette population, l’échan-

La statistique inférentielle élabore des méthodes qui permettent de porter un juge-

Exemples : l’inférence peut être illustrée à partir de l’exemple de l’échantillon de 158

- estimation car il faut proposer une valeur pour le paramètre µ ;

- ponctuelle car il ne faut proposer qu’une seule valeur pour µ .

2. Estimation par intervalle de confiance

Estimation ponctuelle, estimation par intervalle de confiance et tests d’hypothèses

2. Comment choisir l’échantillon ?

Voici une marche à suivre pour planifier l’échantillonnage :

2. choisir le procédé d’observation et son mode de passation (questionnaire, test psy-

3. identifier les bases de sondage disponibles et choisir la technique d’échantillonnage.

5. choisir la taille de l’échantillon. En principe, il vaut mieux avoir le plus de données

2.2 Représentativité de l’échantillon

Le but premier du statisticien est de choisir un échantillon au coût calculé tout en

L’échantillon diffère de la population étudiée pour un caractère (numéro privé non

2.3 Biais et erreurs dans l’échantillonnage

– On appelle erreur d’échantillonnage la différence entre la population et l’échantil-

– Enfin, on appelle erreurs indépendantes celles qui sont dues uniquement à la

2.4 Sélection de l’échantillon

Voici quelques méthodes pour sélectionner l’échantillon.

A. Les méthodes non aléatoires

– L’échantillon par individus types

– L’échantillon par quota

B. Les méthodes aléatoires

– L’échantillon aléatoire simple

00. Abbado 25. Gloschmann 50. Mehta 75. Santini

aléatoires sont utilisés.

– L’échantillonnage aléatoire systématique

– L’échantillon classifié ou stratifié

– L’échantillon groupé à deux degrés

– L’échantillon par grappes

3.1 Distribution de probabilité d’une observation individuelle

Tableau V.1 –. Distribution du nombre d’enfants par ménage.

lités des résultats possibles xi . On pourra par conséquent écrire

P (X = 0) = 0.1 , P (X = 1) = 0.2 , ···

Le Tableau V.1 prendra alors la forme

Tableau V.2 –. Distribution de probabilité du nombre d’enfants par ménage.

P (X1 = 1) = 0.2 , P (X1 = 2) = 0.3 , ...

Chaque observation individuelle a la même distribution de probabilité P (x)

– À partir de P (x) , on peut calculer µ , la moyenne de la population, et la variance σ 2 ,

xi P (xi ) xi P (xi ) x2i x2i P (xi )

1 0.2 0.2 1 0.2

2 0.3 0.6 4 1.2

3 0.15 0.45 9 1.35

4 0.1 0.4 16 1.6

5 0.05 0.25 25 1.25

6 0.05 0.3 36 1.80

7 0.03 0.21 49 1.47

8 0.02 0.16 64 1.28

Nous aurons donc

– Supposons maintenant que nous tirions aléatoirement cinq ménages de la population,

P (X1 = 1,X2 = 2,X3 = 0,X4 = 1,X5 = 4)

= P (X1 = 1) P (X2 = 2) P (X3 = 0) P (X4 = 1) P (X5 = 4)

= (0.2) (0.3) (0.1) (0.2) (0.1)

On en déduit la propriété suivante :

Dans un échantillon aléatoire simple de taille n , les n observations

3.2 Statistiques et paramètres

À partir d’un échantillon donné, on peut calculer, comme on l’a vu au Chapitre 2,

Notre objectif est d’estimer les paramètres de la population.

Ici, X sera donc un estimateur de µ .

3.4 Distribution d’échantillonnage de X

– La moyenne d’échantillonnage, X , est définie par

Solution : on sait que