Vous êtes sur la page 1sur 77

Chapitre V

Échantillonnage – Distribution
d’échantillonnage

1. Introduction

La statistique inférentielle repose sur une idée simple : il existe un ensemble d’individus
appelé population dont les caractéristiques ne sont pas connues.

À partir de l’observation d’un sous-ensemble d’individus de cette population, l’échan-


tillon, on va chercher à déterminer, à induire, les principales caractéristiques de la popu-
lation.

La statistique inférentielle élabore des méthodes qui permettent de porter un juge-


ment, de décider à propos de la population, au vu des résultats obtenus pour l’échantillon,
en utilisant entre autres le calcul des probabilités.

Exemples : l’inférence peut être illustrée à partir de l’exemple de l’échantillon de 158


ménages du quartier A . Voici les trois types de questions abordées :

1. Estimation ponctuelle
On connaı̂t le revenu moyen de l’échantillon des 158 ménages du quartier A
( x = 7348 € ).
§ V. Échantillonnage – Distribution d’échantillonnage

Peut-on inférer une estimation du revenu moyen, que nous noterons µ , de l’ensemble
de tous les ménages du quartier A?
Il s’agit d’une estimation ponctuelle :

- estimation car il faut proposer une valeur pour le paramètre µ ;

- ponctuelle car il ne faut proposer qu’une seule valeur pour µ .

2. Estimation par intervalle de confiance


Il est quasiment impossible que l’estimation x (moyenne de l’échantillon) proposée
pour µ (moyenne de la population) coı̈ncide exactement avec la vraie valeur in-
connue de µ . La vraie valeur µ est la moyenne des revenus qui serait obtenue en
réalisant, lorsque c’est possible, un recensement. Le calcul des probabilités va per-
mettre de déterminer un intervalle, centré en la moyenne de l’échantillon x , dans
lequel la vraie valeur µ va vraisemblablement se situer.
Il s’agit alors d’une estimation par intervalle de confiance.

3. Test d’hypothèses
Une hypothèse est formulée en fonction de la connaissance générale du phénomène
étudié. Par exemple, d’après une enquête, le revenu moyen des ménages de l’agglo-
mération à laquelle appartient le quartier A est de 8000 € par mois. On peut se
demander si le revenu moyen dans le quartier A est supérieur à 8000 € (première
hypothèse) ou au contraire s’il est inférieur à 8000 € (deuxième hypothèse). Le choix
entre ces deux hypothèses se fera sur la base d’un échantillon dans le quartier A .
Dans notre échantillon dans le quartier A , x = 7348 € . L’écart entre cette valeur et
la valeur 8000 € , proposée par la première hypothèse, est-il le reflet d’une véritable
différence de revenus, ou n’est-il que la conséquence des aléas liés à l’utilisation d’un
échantillon pour décider?

Estimation ponctuelle, estimation par intervalle de confiance et tests d’hypothèses


constituent les bases de la statistique inférentielle.
Ces questions — estimation, précision de l’estimation, . . . — se posent parce que seule
une partie de la population, l’échantillon, est connue.
Si l’ensemble de tous les ménages du quartier A était étudié (recensement), les questions
précédentes n’auraient plus d’intérêt : les vraies valeurs, µ et σ en particulier, seraient
connues exactement, aux erreurs d’observation près.
§ V. Échantillonnage – Distribution d’échantillonnage

L’objet de l’inférence statistique est donc de fournir des outils pour établir un jugement
sur la population à partir des informations obtenues de l’échantillon.

2. Comment choisir l’échantillon ?


2.1 Planification de l’échantillon

Voici une marche à suivre pour planifier l’échantillonnage :


1. identifier et cerner la population : par exemple, si on souhaite effectuer une enquête
auprès des cadres d’une entreprise, il faut que le concept de cadre soit bien défini;

2. choisir le procédé d’observation et son mode de passation (questionnaire, test psy-


chologique, . . . );

3. identifier les bases de sondage disponibles et choisir la technique d’échantillonnage.


La seule méthode vraiment valable est le choix au hasard. Comment le réaliser
concrètement?

4. choisir les méthodes statistiques que l’on va utiliser. Si on attend d’avoir les données
pour faire ce choix, nous risquons – même inconsciemment – de choisir alors la
méthode qui favorise le plus nos hypothèses.

5. choisir la taille de l’échantillon. En principe, il vaut mieux avoir le plus de données


possibles, mais il ne faut pas oublier la contrainte du coût. Il faut donc veiller au
rapport Qualité-Prix.
D’autre part, plus la taille de l’échantillon est grande, plus les erreurs de mesure
risquent de se produire : codification absente ou erronée, cas particuliers et rares qui
n’ont pas été prévus dans le questionnaire, . . .
De plus, si la taille de l’échantillon est trop grande, en raison du coût élevé du
dépouillement, le questionnaire devra être simple, et se limiter parfois aux données
factuelles, faciles à obtenir auprès des enquêtés.
§ V. Échantillonnage – Distribution d’échantillonnage

2.2 Représentativité de l’échantillon

Le but premier du statisticien est de choisir un échantillon au coût calculé tout en


maintenant une représentation la meilleure possible, cohérente avec les objectifs de l’étude.
La représentativité est donc liée à l’existence d’une base de sondage et à la mise en oeuvre
d’un processus de choix aléatoire des individus de l’échantillon.

Base de sondage

Pour que tout individu puisse figurer dans l’échantillon, il faut disposer au départ d’une
base de sondage complète, c’est-à-dire d’une liste, d’un recensement, de tous les individus
de la population étudiée.

Les bases de sondage sont innombrables : fichiers de personnels dans les entreprises,
fichiers de bénéficiaires de prestations dans les administrations sociales, annuaires télépho-
niques, listes électorales, etc.
L’annuaire téléphonique pourrait par exemple être sollicité pour élaborer un échantillon :
mais ce n’est pas une base de sondage exhaustive, car tout le monde n’a pas le téléphone
(cette restriction est de moins en moins vraie), et surtout de nombreux abonnés ont un
numéro privé non accessible (de 10 à 15 %). Si le tirage est aléatoire, l’échantillon ne sera
représentatif que des seuls ménages dont le numéro de téléphone est accessible. Ceux qui
protègent leur vie privée disposent certainement d’un niveau de vie supérieur aux autres.
Inversement, ceux qui n’ont pas le téléphone sont probablement plus pauvres. Le revenu
moyen, calculé sur un échantillon issu de l’annuaire, serait vraisemblablement différent de
celui calculé sur un échantillon de l’ensemble des ménages.

L’échantillon diffère de la population étudiée pour un caractère (numéro privé non


accessible), il est certain qu’il en diffère aussi pour d’autres qui lui sont liés, en particulier le
revenu. L’échantillon est biaisé, car conduisant à des résultats systématiquement déformés,
et les estimations bâties sur l’échantillon sont également biaisées.

Signalons également qu’il n’existe pas toujours de bases de sondage pour l’étude que
l’on souhaite faire. Si, par exemple, on veut enquêter sur la manière dont les homosexuels,
ou les drogués, se protègent du sida, on ne trouvera pas de base de sondage répertoriant
les homosexuels ou les drogués de la région où on souhaite effectuer cette étude.
§ V. Échantillonnage – Distribution d’échantillonnage

2.3 Biais et erreurs dans l’échantillonnage

Rien ne garantit qu’un échantillon, même aléatoire, soit représentatif d’une population.
On peut avoir sélectionné un nombre disproportionné d’éléments dans l’une ou l’autre
catégorie.
Distinguons trois types d’erreurs : l’erreur d’échantillonnage, le biais d’échantillonnage
et les erreurs indépendantes de l’échantillonnage.

– On appelle erreur d’échantillonnage la différence entre la population et l’échantil-


lon qui est due uniquement à la particularité des éléments qui ont été choisis. Par
exemple, dans un échantillon de 100 personnes, si toutes mesurent plus de 2m05, on
doit logiquement inférer que tout le monde mesure plus de 2m05.
Ici, l’erreur est manifeste. Plus dangereuse est l’erreur de quelques cm qui ne défie
pas le raisonnement et pour laquelle il n’existe pas de moyen de contrôle. L’erreur
d’échantillonnage est donc avant tout le fruit du hasard. On peut y remédier en
augmentant la taille de l’échantillon.

– Les erreurs liées à une mauvaise méthode d’échantillonnage sont appelées biais
d’échantillonnage.
Le biais d’échantillonnage est une tendance à favoriser la sélection d’unités ayant
des caractéristiques particulières. Considérons l’exemple historique suivant. Lors des
élections américaines de 1936 entre Roosevelt et Landon, le “Literary Digest” avait
interrogé plusieurs millions de personnes et avait prédit une victoire bien tranchée de
Landon. Cette erreur était due au fait que l’échantillon avait été choisi dans les an-
nuaires téléphoniques. Or, au sortir de la crise, peu nombreux étaient les démocrates
qui pouvaient se permettre un tel luxe.
Le biais d’échantillonnage est très difficile à éviter et existe dans presque tous les
échantillons. Malheureusement, il n’est pas influencé par la taille de l’échantillon.
L’exemple le plus fréquent de biais est le biais de non-réponse, c’est-à-dire que
certains éléments de la population n’ont aucune chance de figurer dans l’échantillon
(par exemple les travailleurs qui ne sont pas à leur domicile lorsque les enquêteurs
passent pour les sondages).
Dans ce dernier cas, on peut tenter de remédier à la situation en multipliant les ten-
tatives de contact ou les moments de contact, en motivant les personnes contactées,
...
D’autre part, des biais d’échantillonnage peuvent également se produire lorsque la
§ V. Échantillonnage – Distribution d’échantillonnage

base de sondage utilisée n’est pas conforme à la population que l’on souhaite étudier,
ou si elle est incomplète.

– Enfin, on appelle erreurs indépendantes celles qui sont dues uniquement à la


manière dont l’observation est faite (par exemple dans les sciences expérimentales :
mauvais fonctionnement du matériel, variations dans les conditions d’expériences;
dans les enquêtes : questions mal formulées, . . . ).

2.4 Sélection de l’échantillon

Voici quelques méthodes pour sélectionner l’échantillon.

A. Les méthodes non aléatoires

– L’échantillon de convenance
Cette méthode consiste à choisir les éléments les plus facilement accessibles. Chaque
jour, nous tirons des conclusions basées sur notre expérience personnelle.
Cet échantillonnage a l’avantage d’être peu cher mais on ne peut éviter un biais
d’échantillonnage (soit de non-réponse, soit dû à l’activité de minorités). Parfois, on
sélectionne un échantillon de convenance parce que ce sont les seuls échantillons dis-
ponibles. Il n’existe par exemple pas de base de sondage (complète) pour les drogués,
ou pour les homosexuels d’une région.
Ce type d’échantillon peut avoir une validité suffisante, à condition que l’on contrôle
suffisamment le processus. On peut, par exemple, effectuer chaque année une enquête
sur le Sida, auprès de drogués ou d’homosexuels, de manière à limiter le biais éventuellement
attaché à une enquête unique.

– L’échantillon de jugement
On choisit ici l’échantillon suivant les conseils de quelqu’un qui connaı̂t bien les
caractéristiques de la population. Il est utilisé dans les cas de populations très
hétérogènes, si l’échantillon est très petit, quand on veut assurer la représentativité
de toutes les classes de la population. Par définition, il est sujet au biais et donc n’est
à utiliser que s’il n’y a pas d’autre solution.
§ V. Échantillonnage – Distribution d’échantillonnage

– L’échantillon par individus types


La méthode consiste à sélectionner des individus dont les caractéristiques sont les
plus proches des valeurs moyennes de l’ensemble de la population. Ainsi, pour des
résultats d’élections, les communes qui ont une composition de leur électorat selon
l’âge, la catégorie sociale, etc., et des résultats antérieurs proches de la moyenne
nationale, sont sélectionnés dans l’échantillon.

– L’échantillon par quota


Cette méthode est la plus célèbre et la plus employée des méthodes. Elle consiste à
bâtir un modèle réduit de la population étudiée, c’est-à-dire un échantillon, qui com-
porte des individus en mêmes proportions que la population pour des variables essen-
tielles, comme l’âge, le sexe, la catégorie de communes, la catégorie sociale, etc. Les
enquêteurs choisissent eux-mêmes les personnes à interroger en respectant les diverses
proportions, les quotas, qui leur sont fixées. Cette méthode ressemble à la méthode
par stratification (voir plus loin), mais en diffère par le mode de détermination des
personnes à interroger, qui n’est pas aléatoire.

B. Les méthodes aléatoires

– L’échantillon aléatoire simple


On choisit l’échantillon de telle façon que chaque élément de la population ait la
même probabilité d’être choisi. Pour le réaliser, il faudrait tirer au hasard dans une
urne où chaque élément de la population est représenté par un morceau de papier, ce
qui n’est évidemment pas toujours réalisable. Pratiquement, on utilise les tables de
nombres aléatoires. Ces tables groupent des échantillons de nombres tirés au hasard
qui ont résisté à tous les tests permettant de détecter un biais.
Comment utiliser ces tables? Supposons que, parmi 100 chefs d’orchestre, on désire
en choisir 10. Rangeons-les d’abord par ordre alphabétique et numérotons-les de 00
à 99 :
§ V. Échantillonnage – Distribution d’échantillonnage

00. Abbado 25. Gloschmann 50. Mehta 75. Santini


01. André 26. Hannikainen 51. Mitropoulos 76. Sargent
02. Anasov 27. Hollingsworth 52. Monteux 77. Scherchen
03. Ansermet 28. Horenstein 53. Morel 78. Schippers
04. Argenta 29. Horvat 54. Mravinsky 79. Schmidt-Isserstedt
05. Barbirolli 30. Jacquillat 55. Newman 80. Sejna
06. Beecham 31. Jorda 50. Ormandy 81. Serafin
07. Bernstien 32. Karajan 57. Paray 82. Silvestri
08. Black 33. Kempe 58. Patane 83. Skrowaczewski
09. Bloomfield 34. Kertesz 59. Pedrotti 84. Slatkin
10. Bonynge 35. Klemperl 60. Perlea 85. Smetacek
11. Boult 36. Kletzki 61. Prêtre 86. Solti
12. Cantelli 37. Klima 62. Previra 87. Stien
13. Cluytens 38. Kondrashin 63. Previtali 88. Steinberg
14. Dorati 39. Kostelanetz 64. Prohaska 89. Stokowski
15. Dragon 40. Koussevitzky 65. Rekai 90. Svetlanov
16. Erede 41. Krips 66. Reiner 91. Swarowsky
17. Ferencsik 42. Kubelik 67. Reinhardt 92. Szell
18. Fiedler 43. Lane 68. Rignold 83. Toscanini
19. Fistoulan 44. Leinsdorf 69. Ristenpart 94. Van Otterloo
20. Fricsay 45. Maag 70. Rodzinski 95. Van Remoortel
21. Frühbeck de Burgos 46. Maarzel 71. Rosenthal 96. Vogel
22. Furtangler 47. Mackerras 72. Rozhdestvensky 97. Von Matacic
23. Gamba 48. Markevitch 73. Rowicki 98. Walter
24. Giulini 49. Martin 74. Sanderling 99. Watanabee

Dans la table des nombres aléatoires, on lit 10 nombres en les parcourant dans le
sens que l’on veut (horizontal, vertical, diagonal). Remarquons que le choix de ce sens
doit être effectué avant de regarder la table. On lit donc la table jusqu’à ce qu’on ait
trouvé ainsi 10 nombres différents entre 00 et 99. À chacun de ces nombres, on fait
correspondre le chef d’orchestre répertorié dans la liste alphabétique.
Par exemple : 15 Dragon

62 Previra

38 Kondrashin

... ...

Ces échantillons sont totalement exempts de biais. Seul le facteur chance peut encore
causer des surprises. La procédure que nous venons de décrire s’appelle l’échantillon-
nage aléatoire simple. D’autres types d’échantillonnages au moins partiellement
§ V. Échantillonnage – Distribution d’échantillonnage

aléatoires sont utilisés.

– L’échantillonnage aléatoire systématique


Cette méthode consiste à choisir un élément d’une façon aléatoire et ensuite de
prendre ses suivants à un intervalle constant de distance. Par exemple, considérons
une enquête de Belgacom pour connaı̂tre les factures moyennes des abonnés. Si
on désire interroger vingt abonnés dans la zone de Bruxelles, il suffit de tirer un
numéro au hasard (par exemple, 02/1234567), puis ajouter 500 pour obtenir les
autres (02/1235067, 02/1235567, . . . ).
Il existe un danger de biais si les numéros ne sont pas attribués au hasard. Par
exemple, les firmes cherchent parfois à obtenir un numéro facile à retenir (par exemple
02/1235555).

– L’échantillon classifié ou stratifié


Ici, on choisit un échantillon aléatoire simple dans chacune des classes prédéterminées
d’une population. Ceci est souvent utilisé dans les enquêtes. Par exemple, si la liste
des ménages du quartier A contient l’indication de chaque catégorie sociale, une
méthode consiste à réaliser un sondage dans chacune de ces catégories, appelées
strates. Cette méthode améliore en général nettement la qualité du sondage.

– L’échantillon groupé à deux degrés


La méthode peut être illustrée comme suit : tirons par exemple un échantillon d’im-
meubles dans le quartier A (premier degré) et ensuite un échantillon de logements
dans chaque immeuble (deuxième degré). Cette méthode conduit à ne dresser la liste
des logements que pour les seuls immeubles désignés au premier tirage. Elle permet
aussi de concentrer les enquêtes et peut donc être moins coûteuse que le sondage
simple.

– L’échantillon par grappes


Dans cet échantillon, les individus sont tirés par grappes. Dans une enquête par
exemple, plutôt que d’interviewer 1000 personnes tirées au hasard à Bruxelles, on
divise la ville en une série de quartiers ou de groupes de maisons dans lesquels tous les
individus sont systématiquement interrogés. Ces groupes ou sous-groupes d’individus
sont appelés des grappes.
§ V. Échantillonnage – Distribution d’échantillonnage

3. Distribution d’échantillonnage

Dans la suite du cours, nous supposerons que les échantillons sont obtenus par la
procédure d’échantillonnage aléatoire simple.

3.1 Distribution de probabilité d’une observation individuelle

– Supposons, par exemple, qu’un recensement belge récent nous donne la distribution
du nombre X d’enfants par ménage. Notons xi les valeurs de la variable X et fi la
fréquence des xi .

xi fi

0 0.1

1 0.2

2 0.3

3 0.15

4 0.10

5 0.05

6 0.05

7 0.03

8 0.02

Tableau V.1 –. Distribution du nombre d’enfants par ménage.

Comme cette distribution a été obtenue par un recensement, elle peut être considérée
comme la distribution de probabilité du nombre X d’enfants dans la population des
ménages.
On dira, plus simplement, qu’il s’agit de la distribution de probabilité (ou la loi de
probabilité) de la population et on la notera P (X = x) ou, plus simplement P (x) .
La deuxième colonne du Tableau V.1 (fréquences f i ) nous donne donc les probabi-
§ V. Échantillonnage – Distribution d’échantillonnage

lités des résultats possibles xi . On pourra par conséquent écrire

P (X = 0) = 0.1 , P (X = 1) = 0.2 , ···

Le Tableau V.1 prendra alors la forme

xi P (X = xi )

0 0.1

1 0.2

2 0.3

3 0.15

4 0.10

5 0.05

6 0.05

7 0.03

8 0.02

Tableau V.2 –. Distribution de probabilité du nombre d’enfants par ménage.

Si nous tirons une famille au hasard (on dira que l’on effectue une observation indi-
viduelle), la variable aléatoire X1 , qui compte le nombre d’enfants de cette famille,
aura la même distribution de probabilité que la population. On aura, par exemple,

P (X1 = 1) = 0.2 , P (X1 = 2) = 0.3 , ...

En résumé

Chaque observation individuelle a la même distribution de probabilité P (x)


que la population.

– À partir de P (x) , on peut calculer µ , la moyenne de la population, et la variance σ 2 ,


en soulignant qu’ils sont aussi la moyenne et la variance d’une observation individuelle
tirée au hasard.
§ V. Échantillonnage – Distribution d’échantillonnage

xi P (xi ) xi P (xi ) x2i x2i P (xi )

0 0.1 0 0 0

1 0.2 0.2 1 0.2

2 0.3 0.6 4 1.2

3 0.15 0.45 9 1.35

4 0.1 0.4 16 1.6

5 0.05 0.25 25 1.25

6 0.05 0.3 36 1.80

7 0.03 0.21 49 1.47

8 0.02 0.16 64 1.28

1 µ = 2.57 10.15

Nous aurons donc


X
E(X) = µ = xi P (xi ) = 2.57 = E(X1 ) ,
X
var(X) = σ 2 = x2i P (xi ) − µ2 = 10.15 − 6.6049 = 3.5451 = var(X1 ) .

– Supposons maintenant que nous tirions aléatoirement cinq ménages de la population,


afin d’obtenir un échantillon aléatoire simple de cinq ménages.
Calculons la probabilité qu’ils aient respectivement 1 , 2 , 0 , 1 et 4 enfants. Vu la
taille de la population, les variables aléatoires X1 , X2 , X3 , X4 et X5 associées aux
cinq tirages peuvent être considérées comme des variables aléatoires indépendantes.
Nous aurons donc

P (X1 = 1,X2 = 2,X3 = 0,X4 = 1,X5 = 4)

= P (X1 = 1) P (X2 = 2) P (X3 = 0) P (X4 = 1) P (X5 = 4)

= (0.2) (0.3) (0.1) (0.2) (0.1)

= 0.00012 .

On en déduit la propriété suivante :


§ V. Échantillonnage – Distribution d’échantillonnage

Dans un échantillon aléatoire simple de taille n , les n observations


X1 ,X2 , · · · ,Xn sont indépendantes. La distribution de chaque observation Xi
est la même que celle de la population, c’est-à-dire P (x) . Chaque observation
a alors la même moyenne µ et le même écart type σ que la population.

3.2 Statistiques et paramètres

À partir d’un échantillon donné, on peut calculer, comme on l’a vu au Chapitre 2,


différentes valeurs caractéristiques, telles la moyenne ou la variance. De manière générale,
toute caractéristique qui peut être calculée à partir des valeurs d’un échantillon aléatoire
est appelée une statistique. Par exemple,
P
n P
n
Xi (Xi − X)2
i=1 i=1
X= et S2 =
n n
sont des statistiques. X et S 2 varient d’un échantillon à l’autre. Ce sont donc des variables
aléatoires.
Par contre, les valeurs caractéristiques d’une population sont appelées paramètres.
Ce sont des constantes caractérisant des lois de probabilité. Ainsi, la loi Normale est ca-
ractérisée par deux paramètres, µ et σ 2 .

3.3 Estimateur

Notre objectif est d’estimer les paramètres de la population.


Pour estimer µ , la moyenne de la population, il est logique de considérer X , la moyenne
de l’échantillon, encore appelée moyenne d’échantillonnage.

Définition
On appelle estimateur d’un paramètre d’une population une statistique
utilisée pour évaluer la valeur de ce paramètre.

Ici, X sera donc un estimateur de µ .


De la même façon, pour estimer σ 2 , la variance de la population, nous choisirons S 2 ,
la variance de l’échantillon. S 2 sera donc un estimateur de σ 2 . S 2 sera appelée la variance
d’échantillonnage.
§ V. Échantillonnage – Distribution d’échantillonnage

3.4 Distribution d’échantillonnage de X

– La moyenne d’échantillonnage, X , est définie par


X1 + · · · + X n
X= ·
n
Comme les observations individuelles Xi sont des variables aléatoires, X sera égale-
ment une variable aléatoire.

Propriété 1

Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n extrait d’une


population de moyenne µ .
Alors E(X) = µ .

En effet,
 
X1 + X 2 + · · · + X n 1
E(X) = E = n
[E(X1 ) + E(X2 ) + · · · + E(Xn )]
n
1 1
= n
[µ + µ + · · · + µ] = n
·n µ = µ.

Ce résultat est intéressant car il signifie que la moyenne de l’échantillon, X , coı̈nci-


dera, en moyenne, avec la moyenne µ de la population.
Autrement dit, si on tire plusieurs fois un échantillon de taille n de la population,
et si on calcule à chaque fois la moyenne de l’échantillon, les valeurs trouvées auront
tendance à s’agglomérer autour de la moyenne µ (inconnue) de la population.
Lorsque E(X) = µ , on dira que X est un estimateur sans biais (ou non biaisé)
de µ .

– D’autre part, nous souhaiterions savoir dans quelle mesure la moyenne X fluctue
autour de µ .
On montre, par la Propriété 2, que la dispersion des valeurs de X autour de µ est
d’autant plus petite que la taille de l’échantillon est grande.

Propriété 2

Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n extrait d’une


population de moyenne µ et de variance σ 2 .
2
Alors var(X) = σn .
§ V. Échantillonnage – Distribution d’échantillonnage

En effet,
 
X1 + X 2 + · · · + X n 1
var(X) = var = n2
(var(X1 ) + var(X2 ) + · · · + var(Xn ))
n
1 σ2
= n2
n σ2 = n
·

L’écart type de X sera alors


σ
σX = √ · (V.1)
n
Cette caractéristique de l’écart entre la moyenne X de l’échantillon et la moyenne
µ de la population représente l’erreur d’estimation. Elle est couramment appelée
erreur standard, ou encore écart type de l’échantillon.
La formule (V.1) montre explicitement comment l’écart type de X diminue lorsque
la taille de l’échantillon aléatoire augmente. Cela précise l’idée simple selon laquelle
plus l’échantillon est grand, plus X donne une estimation précise de la moyenne µ
de la population.

– Distribution de X pour une population Normale


Supposons que la population a une distribution Normale de moyenne µ et de variance
σ2 .
La propriété suivante donne la distribution de X .

Propriété 3

Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n issu d’une popu-
lation Normale de moyenne µ et de variance σ 2 .
Alors la distribution d’échantillonnage de X est une distribution Normale de
2
moyenne µ et de variance σn .

Ce résultat est en accord avec les deux propriétés précédentes. L’information sup-
plémentaire est que X a une distribution Normale si la population de départ est
Normale.

– Distribution de X pour une population quelconque


Le résultat suivant montre que, même si la population n’est pas Normale, la dis-
tribution d’échantillonnage de X sera approximativement Normale si la taille de
l’échantillon est suffisante.
§ V. Échantillonnage – Distribution d’échantillonnage

Propriété 4 Théorème central limite

Soit X1 ,X2 , · · · ,Xn un échantillon aléatoire simple de taille n extrait d’une


population de moyenne µ et de variance σ 2 .
Alors la distribution d’échantillonnage de X est approximativement (lorsque
2
n est grand), une distribution Normale de moyenne µ et de variance σn .

Remarques
– On considère en général qu’une valeur de n supérieure ou égale à 25 est suffisante
pour garantir le résultat ci-dessus.

– Ce théorème est valable quelle que soit la distribution de la population de départ.

La Figure V.1 illustre cette propriété. Elle reprend trois populations différentes. En
dessous de chaque population, des graphes successifs indiquent comment la forme
de la distribution d’échantillonnage de X se modifie lorsque la taille de l’échantillon
augmente.

La première colonne montre comment X se comporte lorsque l’échantillonnage est


réalisé à partir d’une population Normale. La distribution d’échantillonnage de X
est également Normale (fluctuant autour de µ avec de moins en moins d’erreur, au
fur et à mesure que n augmente).
Dans la seconde colonne, la distribution de la population est rectangulaire et, comme
prévu, la distribution d’échantillonnage de X revêt une forme Normale quand n
augmente. D’ailleurs, elle est déjà pratiquement Normale avec n égal à 5 ou 10 .
La troisième colonne est étonnante. Même avec une asymétrie de la distribution de la
population, la distribution d’échantillonnage de X tend encore à devenir Normale —
bien qu’il faille cette fois une taille d’échantillon un peu plus grande. (Noter qu’elle
devient pratiquement Normale à partir du moment où n = 10 ou 20 ).
§ V. Échantillonnage – Distribution d’échantillonnage

3.5 Applications
Exemple 1 : supposons que la population des tailles des étudiants est Nor-
male de moyenne µ = 175 cm et d’ écart type σ = 8 cm.

1. Si on tire plusieurs échantillons de taille n = 4 et que l’on calcule à chaque fois la


moyenne X de l’échantillon, comment fluctuent ces moyennes?
2. Si on quadruple la taille de l’échantillon, comment varie l’erreur d’estimation, c’est-
à-dire l’écart type de l’échantillon ?

Solution :
1.

E(X) = µ = 175 cm ,
σ 8
σX = √ = = 4 cm .
n 2
Les valeurs de la moyenne de l’échantillon X varient donc autour de la moyenne
µ = 175 cm de la population avec un écart type de 4 cm.

2. On a toujours E(X) = µ = 175 cm. Mais, pour un échantillon aléatoire de taille


n = 16 , l’écart type de l’échantillon sera
σ 8
σX = √ = = 2 cm.
n 4
Un quadruplement de la taille de l’échantillon entraı̂ne un doublement de la précision.

Exemple 2 : soit une population Normale de moyenne µ et de variance σ 2 = 100 . On


extrait aléatoirement de cette population un échantillon de taille 25 .
Quelle est la probabilité que la moyenne d’échantillonnage s’écarte de plus de 3 unités de
la moyenne µ de la population?

Solution : on sait que  


100
X∼N µ, .
25
On a donc    
|X − µ| 3 3
P (|X − µ| > 3) = P √ > =P |Z| > .
σ/ n 10/5 2
La table de la loi normale réduite donne

P (|Z| > 1.5) = (1 − 0.9332) × 2 = 0.1336 .


§ V. Échantillonnage – Distribution d’échantillonnage

Exemple 3 : calcul de la taille d’un échantillon. Soit une enquête destinée à évaluer
le poids moyen des Belges. On désire limiter l’erreur à 2 kg, avec un risque d’erreur de 5% .
Combien d’observations faut-il prendre si on suppose un écart type σ de 20 kg?

Solution : on désire que


P (|X − µ| ≤ 2) ≥ 0.95 .
Si on suppose que la variable poids suit une distribution Normale, on sait que
 
400
X ∼ N µ, .
n
La table de la loi Normale centrée réduite nous apprend que

P (|Z| ≤ 1.96) = 0.95 ,

soit  
(1.96) · 20
P |X − µ| ≤ √ = 0.95 .
n
Pour que l’erreur soit inférieure à 2 , avec une probabilité égale à 0.95 , on choisira donc
n tel que
(1.96) · 20
√ =2,
n
soit  2
(1.96) · 20)
n= = 400 .
2

Exemple 4 : soit une population Normale de moyenne 50 et de variance 100 . On y


prélève un échantillon de taille n = 25 .
Quelle est la probabilité que la moyenne X soit dans l’intervalle [48,52]?

Solution : le problème posé revient à calculer P (48 ≤ X ≤ 52) :

X − 50
X ∼ N (50,4) donc Z= ∼ N (0,1) ,
2

P (48 ≤ X ≤ 52) = P (−1 ≤ Z ≤ 1) = 0.8270 .

Exemple 5 : le temps de service pour un client à une caisse d’un supermarché est une
variable aléatoire d’espérance 1’30” et de variance 1 minute.
Quelle est la probabilité que 50 clients puissent être servis en moins d’une heure?
§ V. Échantillonnage – Distribution d’échantillonnage

Solution : soient X1 ,X2 , · · · ,X50 les temps de service (exprimés en minutes) des 50
clients.
Par le théorème central limite, on a
 
1
X ∼ N 1.5, .
50

La probabilité que les 50 consommateurs soient servis en moins d’une heure est la même
que la probabilité que la moyenne des temps de service des 50 consommateurs soit inférieure
à 1.2 minutes. On a donc
 
X − 1.5 1.2 − 1.5
P (X ≤ 1.2) = P √ ≤ √
1/ 50 1/ 50

= P (Z ≤ −2.121) = 0.017 .

Ce résultat n’est pas étonnant puisque, en moyenne, on attend que les 50 clients soient
servis en 75’.

Remarque : quel est le pourcentage des échantillons dont la moyenne X sera située entre

– µ − σX et µ + σX ?

– µ − 2σX et µ + 2σX ?

– µ − 3σX et µ + 3σX ?

Solution :
 
X−µ
– P (µ − σX ≤ X ≤ µ + σX ) = P −1 ≤ σX
≤1
= P (−1 ≤ Z ≤ 1)
= 0.682 où Z ∼ N (0,1) .

– P (µ − 2σX ≤ X ≤ µ + 2σX ) = P (−2 ≤ Z ≤ 2)


= 0.954 .

– P (µ − 3σX ≤ X ≤ µ + 3σX ) = P (−3 ≤ Z ≤ 3)


= 0.998 .
§ V. Échantillonnage – Distribution d’échantillonnage

Nous pouvons en conclure que, si on tire un grand nombre d’échantillons, en moyenne

– 68.2% des échantillons conduiront à une valeur de X comprise entre µ−σX et µ+σX .

– 95.4% des échantillons conduiront à une valeur de X comprise entre µ − 2σX et


µ + 2σX .

– 99.8% des échantillons conduiront à une valeur de X comprise entre µ − 3σX et


µ + 3σX .
§ V. Échantillonnage – Distribution d’échantillonnage

Population p(x) p(x) p(x)


n=1

Echantillons p(x) p(x) p(x)


n=2

p(x) p(x) p(x)


n=3

p(x) p(x) p(x)


n=5

p(x) p(x) p(x)

n = 10

p(x) p(x) p(x)

n = 20

Figure V.1 –. La distribution d’échantillonnage de X diffère de la distribution de


la population. La colonne de gauche représente l’échantillonnage à partir d’une
population Normale. À mesure que la taille de l’échantillon s’accroı̂t, l’écart
type de X diminue. Les deux colonnes suivantes montrent comment, en dépit du
caractère non Normal de la population, la distribution d’échantillonnage devient
approximativement Normale.
Chapitre VI

L’estimation par intervalle –


Les tests d’hypothèses

1. Estimation par intervalle de confiance

1.1 Introduction

Supposons que l’on veuille connaı̂tre le revenu moyen des habitants d’une grande ville.
Notons µ la vraie valeur de ce revenu moyen. µ est un paramètre inconnu. La seule façon
de le connaı̂tre exactement est de faire un recensement dans cette grande ville.

Prélevons, dans cette ville, un échantillon aléatoire simple de 100 habitants. Une “bon-
ne” estimation de µ est donnée par la moyenne d’échantillonnage X . Si nous prélevons un
second échantillon, on obtiendra presque certainement une autre valeur pour X . D’autre
part, comme X est une variable aléatoire continue, la probabilité pour que X soit exacte-
ment égal à µ est nulle.

C’est pourquoi, lors de l’estimation d’un paramètre, on donnera non seulement sa valeur
estimée, mais également une mesure du risque d’erreur que l’on commet.

Plus souvent cependant, on déterminera autour de la valeur estimée un intervalle


dont on a de bonnes raisons de croire qu’il contiendra la vraie valeur du paramètre. Ainsi,
étant donné un estimateur G d’un paramètre γ , on s’efforce de déterminer de part et
d’autre de G les limites L1 et L2 d’un intervalle tel qu’il ait une probabilité P de conte-
nir γ . En pratique, on se fixe cette probabilité, appelée seuil de confiance; on prend
§ VI. L’estimation par intervalle – Les tests d’hypothèses

généralement P = 0.95 ou 0.99 . Si on choisit un seuil de confiance P = 0.95 , cela si-


gnifie que si on tire un grand nombre d’échantillons, l’intervalle contiendra la vraie valeur
(inconnue) du paramètre, environ 95 fois sur 100.
On peut écrire
P (L1 < γ < L2 ) = P = 1 − α .
Cette probabilité traduit donc la confiance que nous avons dans l’affirmation : γ est compris
entre L1 et L2 . α est appelé le niveau d’incertitude de l’intervalle de confiance.

Un intervalle de confiance est parfois appelé, dans le langage courant, une fourchette
d’estimation.

1.2 Intervalle de confiance pour le paramètre µ d’une loi Nor-


male – σ est connu

Supposons, dans l’exemple précédent, que les revenus des habitants de la grande ville
suivent une distribution Normale N (µ,σ 2 ) où σ est connu. Supposons, par exemple, que
σ = 2000 €. Construisons un intervalle de confiance pour µ .

Dans le chapitre précédent, nous


 avons vu que la moyenne d’échantillonnage, X , suivait
σ2
dans ce cas une distribution N µ, n . Par conséquent, Z = X−µ √σ suit une distribution
n
N (0,1) . Nous avons
!
X −µ
P z α2 ≤ ≤ z1− α2 = 1−α
√σ
n
ou encore  
σ σ
P X − z1− α2 √ ≤ µ ≤ X + z1− α2 √ = 1−α
n n
α
où z1− α2 est le quantile d’ordre 1 − 2
de la distribution N (0,1) .

Remarques :

– Par symétrie de la fonction de densité de la distribution N (0,1) , on a

z1− α2 = −z α2 ·

– Les tables de la distribution N (0,1) nous donnent les valeurs suivantes pour les
quantiles zu en fonction de u :
§ VI. L’estimation par intervalle – Les tests d’hypothèses

u 0.995 0.99 0.975 0.95

zu 2.58 2.33 1.96 1.645

h i
– L’intervalle de confiance Iα (µ) = X − z1− α2 √σ
, X + z1− α2 √σn est centré en X .
n
 
Sa longueur dépend entre autre de l’écart type de X √σn , c’est-à-dire de l’erreur
d’estimation.

Exemple : si, dans l’échantillon des 100 habitants, le revenu moyen est de 7348 €,
l’intervalle de confiance I pour µ , le revenu moyen des habitants de la grande ville, sera
(si nous choisissons un niveau d’incertitude α = 0.05 ) :
 
σ σ
Iα (µ) = X − z1− 2 √ , X + z1− 2 √
α α
n n
 
2000 2000
I0.05 (µ) = 7348 − 1.96 , 7348 + 1.96
10 10

= [6956 , 7740] .

Remarques :
1. On a  
σ σ
P X − 1.96 √ ≤ µ ≤ X + 1.96 √ = 0.95 . (VI.1)
n n
Cela signifie que si on recommence, par exemple, 20 fois le processus de tirer un
échantillon aléatoire simple de 100 habitants, la vraie valeur de µ n’en sera pas
affectée. Par contre, x sera probablement différent d’un échantillon à l’autre. On
obtient ainsi 20 intervalles différents. Nous pouvons donc déduire de la formule (VI.1)
qu’environ 95 % de ceux-ci, soit 19 d’entre eux, devraient contenir la vraie valeur
inconnue de µ .

2. Le paramètre µ de la population est et reste constant. C’est l’intervalle d’estimation


qui est aléatoire car ses bornes dépendent de la variable aléatoire X.

3. Si la taille de l’échantillon augmente, l’écart type d’échantillon σX = √σn diminue, et la


longueur de l’intervalle de confiance diminue. Cet accroissement de la précision est le
§ VI. L’estimation par intervalle – Les tests d’hypothèses

gain résultant de la taille de l’échantillon. Par contre, si l’écart type de la population,


σ , augmente, la longueur de l’intervalle de confiance augmente également.

4. Si le seuil de confiance d’un intervalle de confiance augmente par exemple de 95 % à


99 % , la longueur de l’intervalle de confiance va également augmenter.

1.3 Intervalle de confiance pour le paramètre µ d’une loi Nor-


male – σ est inconnu

Dans le paragraphe précédent, on a supposé l’écart type σ de la population connu. Ce


n’est en général pas le cas.

Pour obtenir un intervalle de confiance pour µ , nous devons estimer σ . Pour ce faire,
nous pouvons utiliser S 2 , la variance d’échantillonnage. Cependant,
n
X
2
S = 1
n
(Xi − X)2
i=1
et
E(S 2 ) = n−1
n
σ2 ;

S 2 n’est donc pas un estimateur non biaisé de σ 2 .


Par contre,
Xn
02
S = n−11
(Xi − X)2
i=1
2
est un estimateur non biaisé de σ .
Nous estimerons donc σ 2 par S 0 2 .

Remarques :

– Si la taille de l’échantillon est suffisamment grande ( n ≥ 30 ), on peut montrer


que la distribution d’échantillonnage de la statistique X−µ
S0

sera approximativement
n
une distribution N (0,1) . L’intervalle de confiance pour µ au niveau d’incertitude α
prendra alors la forme
 
S0 S0
Iα (µ) = X − z1− α2 √ , X + z1− α2 √ .
n n

– Si la taille de l’échantillon est petite ( n < 30 ), la distribution d’échantillonnage de


la statistique Tn = X−µ S0

est une distribution de Student à (n − 1) degrés de liberté.
n
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Sa fonction de densité aura la forme suivante :

0.4 N(0,1)

n=3

n=1
0.2

0.1
x

-3 -2 -1 0 1 2 3

Figure VI.1 –.

L’intervalle de confiance pour µ sera alors


 
S0 S0
Iα (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √
n n
α
où tn−1,1− α2 est le quantile d’ordre 1 − 2
de la loi de Student à (n − 1) degrés de
liberté.

Les valeurs de ces quantiles sont fournies dans des tables (voir annexe).

Exemple : dans une classe, on extrait un échantillon aléatoire simple de 4 notes : 64, 66,
89 et 77 . On suppose que les notes de la classe suivent une distribution Normale.
Calculer un intervalle de confiance à 95 % pour la moyenne des notes de toute la classe.

Solution : ici n = 4 est petit; l’intervalle de confiance pour µ , la moyenne des notes de
toute la classe, sera
 
S0 S0
Iα (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ .
n n

On a

– α = 0.05 donc tn−1,1− α2 = t3,0.975 = 3.182 ;


§ VI. L’estimation par intervalle – Les tests d’hypothèses

0
– s 2 = 132.7 ;

– x = 74 ;

et donc
" √ √ #
132.7 132.7
I0.05 (µ) = 74 − 3.182 √ , 74 + 3.182 √
4 4

= [56,92] .

Avec un intervalle de confiance à 95 %, on conclut que la note moyenne de la classe


entière se situe entre 56 et 92. C’est un intervalle bien grossier dû à une trop petite taille
de l’échantillon.

1.4 Intervalle de confiance pour une proportion

Nous ne considérons ici que le cas des grands échantillons ( n ≥ 30 ).

Considérons l’ensemble des étudiants et intéressons-nous à la proportion


p de fumeurs.
Pour estimer p , on extrait, de la population des étudiants , un échantillon
aléatoire simple de 100 étudiants. Appelons X la variable aléatoire qui compte le nombre
de fumeurs dans cet échantillon.
Alors, X ∼ Bi(n,p) où n = 100 .
Nous avons vu précédemment que l’on pouvait approximer la variable aléatoire bino-
miale X par une variable aléatoire Normale X ≈ N (np,npq) .
D’autre part, nous pouvons estimer p par p̂ = Xn . De plus,

X  pq 
≈ N p,
n n
et donc
p̂ − p
p pq ≈ N (0,1) .
n
L’intervalle de confiance pour p s’écrira
" r r #
p̂q̂ p̂q̂
Iα (p) ≈ p̂ − z1− α2 , p̂ + z1− α2
n n
α
où z1− α2 est le quantile d’ordre 1 − 2
de la loi N (0,1) .
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Dans notre exemple, si le nombre de fumeurs dans l’échantillon des 100 étudiants
est de 40, on aura, avec un niveau d’incertitude de 0.05,

p̂ = 0.4 , q̂ = 0.6
et " r r #
0.4 × 0.6 0.4 × 0.6
I0.05 (p) ≈ 0.4 − 1.96 , 0.4 + 1.96
100 100

= [0.304 , 0.496] .

2. Tests d’hypothèses

En se basant sur une théorie, une expérience antérieure ou une argumentation logique,
l’expérimentateur est amené, au cours de sa recherche, à formuler une hypothèse au sujet
du phénomène qu’il étudie et de la variable qu’il mesure.
Le test d’hypothèses est le processus qui consiste à confronter l’hypothèse émise avec
la réalité expérimentale en vue de prendre une décision quant à sa validité (accepter ou
rejeter l’hypothèse).

2.1 Principes généraux des tests d’hypothèses

Exemple 1 : supposons que nous lancions 100 fois une pièce de monnaie, et que nous
observions 65 fois “pile” . Soit X la variable aléatoire qui compte le nombre de “pile” :
x = 65 .
Si la pièce est équilibrée, nous nous attendons à obtenir un résultat proche de x =
50 , mais nous ne sommes pas surpris puisque nous savons que les résultats d’une telle
expérience peuvent s’écarter de 50 par simple hasard. Cependant, un certain scepticisme
peut nous amener à croire que ce résultat pourrait ne pas être dû seulement au hasard;
cela voudrait dire que nous pensons à un facteur causal (une monnaie mal équilibrée),
responsable de l’écart obtenu entre la valeur observée ( x = 65 ) et la valeur que l’on aurait
pu attendre avec une monnaie équilibrée ( x = 50 ).
Le problème est posé : notre monnaie est-elle équilibrée , ou est-elle biaisée en faveur
de “pile”? Pour répondre à cette question, nous devons décider ici entre deux hypothèses :
“la pièce est équilibrée” ou “la pièce est biaisée, en faveur de pile” .
La première hypothèse est celle qu’on veut tester (il s’agit souvent d’une hypothèse
de non différence). Nous l’appellerons l’hypothèse nulle, que nous noterons H0 . L’autre
§ VI. L’estimation par intervalle – Les tests d’hypothèses

hypothèse, que nous appellerons l’hypothèse alternative, sera notée HA . Si p désigne


la proportion de “pile” lors des 100 lancers, ces hypothèses s’écriront :

H0 : p = 0.5 ,
HA : p > 0.5 .

Si l’hypothèse nulle est vérifiée, X , la variable aléatoire qui compte le nombre de fois qu’on
obtient “pile” en lançant 100 fois une pièce de monnaie, aura une distribution Bi (100,0.5) .
Nous avons vu que X peut être approximée par une variable aléatoire N (50,25) et nous
utiliserons cette approximation dans cet exemple.

Solution 1 : calcul de la p-valeur

Tout d’abord, nous devons admettre qu’il est possible d’obtenir jusqu’à 100 fois “pile”
sur 100 lancers d’une pièce de monnaie équilibrée, simplement par chance ! Il faut donc aussi
admettre que le résultat xobs = 65 est possible sans que cela implique nécessairement
une sinistre machination d’un adversaire au jeu de “pile ou face”.
Cependant, la probabilité d’obtenir 100 fois “pile” est sans aucun doute tellement faible
qu’elle peut être négligée, et, avec ce résultat, vous affirmeriez avec une certitude presque
absolue que la pièce de monnaie n’est pas équilibrée.
Par conséquent, notre problème revient à trouver la probabilité d’obtenir, par chance,
65 fois “pile” ou plus en utilisant une monnaie équilibrée. Nous noterons cette probabilité
PH0 (X ≥ 65) , l’indice H0 signifiant que nous calculons cette probabilité en supposant
l’hypothèse H0 vérifiée.
Ce calcul nous est déjà familier :

X est approximativement N (µ,σ 2 ) avec µ = n p = 50 ,

et σ 2 = n p q = 25 .

On a donc
X −µ
Z= ∼ N (0,1) .
σ
§ VI. L’estimation par intervalle – Les tests d’hypothèses

On obtient
 
X−µ 65 − 50
PH0 (X ≥ 65) = P ≥
σ 5

= P (Z ≥ 3)

= 1 − P (Z ≤ 3)

= 1 − 0.99865

= 0.00135 .

On trouve donc que la probabilité d’obtenir 65 fois “pile” ou plus, en lançant 100 fois
une pièce de monnaie équilibrée, n’est que 0.00135 , ce qui est vraiment très peu. Cette
valeur de 0.00135 est appelée “probabilité critique pour H0 ” ou encore “ p-valeur pour
H0 ”. Elle mesure ce que les données disent de la crédibilité de H0 . Si la pièce est équilibrée
( p = 21 ), nous avons à peu près une chance sur mille d’observer un nombre de pile supérieur
ou égal à 65 . Cette probabilité est trop faible. Nous rejetterons donc H0 et la décision
logique sera donc de conclure que la monnaie n’est pas équilibrée.
Notre décision n’est cependant pas une certitude absolue. Le but des tests d’hypothèses
est de nous aider à porter un jugement face à une incertitude, avec l’avantage de pouvoir es-
timer le degré d’incertitude. Dans notre exemple, la possibilité d’obtenir, avec une monnaie
équilibrée, 65 fois “pile” ou plus existe, et la probabilité de cette possibilité est 0.00135 .
Par conséquent, la probabilité d’avoir pris une décision fausse est 0.00135.

En général, on rejette H0 si la p-valeur pour H0 est faible, c’est-à-dire si elle est inférieure
à une valeur préalablement fixée, qui est appelée le niveau du test d’hypothèses, et qui
est notée α . Généralement, on choisit α = 0.05 , ou α = 0.01 .
L’ensemble des valeurs qui conduisent au rejet de H0 s’appelle la région critique du
test.
Dans notre exemple, la p-valeur est égale à 0.00135 .

0.00135 < 0.05 et 0.00135 < 0.01 .

On rejette donc H0 aux niveaux 0.05 et 0.01 .

Solution 2 : calcul de la région critique d’un test d’hypothèses

On peut résoudre un test d’hypothèses en calculant directement la région critique du


test.
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Calculons donc la région critique du test d’hypothèses précédent, pour un niveau de


5% (c’est-à-dire α = 0.05 ).
Nous rejetterons donc H0 , au niveau α = 0.05 , si le nombre de “pile” observé X est
“trop grand”, c’est-à-dire si X ≥ k où la constante k est déterminée par

PH0 (X ≥ k) = 0.05 .

La variable aléatoire X peut être approximée par une variable aléatoire N (50,25) .
On a donc  
k − 50
PH0 (X ≥ k) = P Z ≥ = 0.05 .
5
Les tables de la loi N (0,1) (annexe) donnent :
k − 50
= 1.64
5
et donc
k = 58.20 .
Comme la valeur observée de X , notée xobs , est supérieure à la valeur de k :

xobs = 65 ≥ k = 58.20 ,

on rejette H0 au niveau α = 0.05 . La région critique sera donc {x : x ≥ 58.20} . Cela


signifie que, si l’hypothèse nulle est vraie (la pièce est équilibrée), on n’a que 5 % de chance
de trouver un échantillon pour lequel le nombre de “pile” dépasse 59 .

Exemple 2 : un test de mémoire consiste à présenter aux étudiants, pendant deux mi-
nutes, sur transparent, les images de 24 objets. On demande ensuite aux étudiants de
tenter de retranscrire en deux minutes la liste des objets. On note pour chaque étudiant le
nombre de mots retenus. On sait que les résultats de l’application de ce test de mémoire sur
un grand nombre d’étudiants est une variable aléatoire Normale de moyenne µ = 17.683
et de variance σ 2 = 6.4 .

Une firme pharmaceutique développe une nouvelle potion destinée à stimuler la mémoire
à court terme et aider, entre autres, les étudiants à bloquer un maximum de matière la
veille d’un examen.
Pour pouvoir mettre ce médicament sur le marché, la firme doit prouver que le médi-
cament a réellement de l’effet et elle décide d’entreprendre une campagne d’essais de son
médicament sur une série d’étudiants. Plus précisément, elle soumet ce test de mémoire à
un groupe d’étudiants auxquels elle a, au préalable, fait prendre le médicament.
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Notons µ0 la moyenne de la population de référence : celle des étudiants n’ayant pas


pris le médicament; nous savons que µ0 = 17.683 .
Notons µ la moyenne de la population hypothétique des étudiants qui prendraient
le médicament. Cette valeur µ est évidemment inconnue car elle fait l’objet du test d’hy-
pothèses.
Tester si le médicament a de l’effet sur la mémoire se fait donc en trois étapes.

1. – On fixe l’hypothèse nulle et l’hypothèse alternative.

- L’hypothèse nulle sera une affirmation de “non différence”. Nous dirons


donc ici qu’il n’y a pas de différence entre le score moyen µ0 de la population
des étudiants n’ayant pas pris le médicament et le score moyen µ de la
population hypothétique des étudiants ayant pris le médicament; ou encore
que le médicament n’a pas d’effet sur la mémoire à court terme.
Nous l’écrirons sous la forme générale :

H0 : µ = µ 0 ,

c’est-à-dire dans l’exemple :

H0 : µ = 17.683 .

- L’hypothèse alternative peut être formulée de différentes façons. Dans


cet exemple, on s’attend à une augmentation du score chez les étudiants
ayant pris le médicament et l’hypothèse alternative (celle que l’on souhaite
mettre en évidence) s’écrira donc sous la forme générale

HA : µ > µ 0 ,

c’est-à-dire dans l’exemple :

HA : µ > 17.683 .

L’hypothèse alternative affirme donc que le médicament a pour effet d’aug-


menter la mémoire à court terme.

– On fixe la taille de l’échantillon; par exemple ici n = 10 .


§ VI. L’estimation par intervalle – Les tests d’hypothèses

– On fixe le niveau du test; par exemple α = 0.05 (ou α = 5 %).

2. On supposetemporairement
 que l’hypothèse nulle est vraie. X sera une variable
σ2
aléatoire N µ0 , n , c’est-à-dire une variable aléatoire N (17.683,0.64) .
On calcule la région critique. On rejettera donc H0 , au niveau α = 0.05 , si X ≥ k
où la constante k est déterminée par PH0 (X ≥ k) = α . Or, sous H0 ,

X ∼ N (17.683,0.64) .

On se demande donc à quel seuil correspond la valeur α = 0.05 .


Donc

PH0 (X ≥ k) = 0.05
 
X − 17.683 k − 17.683
⇔ P H0 √ ≥ √ = 0.05
0.64 0.64
 
k − 17.683
⇔ P Z≥ √ = 0.05 .
0.64
Dans les tables de la distribution N (0,1) , on trouve P (Z ≥ 1.64) = 0.05 . Donc

k − 17.683
√ = 1.64
0.64
c’est-à-dire k = 18.995 .
L’indice “ H0 ” est présent pour insister sur le fait que la probabilité est calculée
en supposant que l’hypothèse H0 est vraie, c’est-à-dire que X a une distribution de
moyenne 17.683.
Cette valeur de 18.995 correspond au seuil critique; elle définit la région de rejet de
l’hypothèse nulle {(x1 , · · · ,xn )} : x ≥ 18.995} . Cela signifie que, si l’hypothèse nulle
est vraie (le médicament n’a pas d’effet), on n’a que 5 % de chance de trouver un
échantillon dont la moyenne des scores soit supérieure à 18.995.

3. On tire l’échantillon. Si xobs est dans la région de rejet, on considère que l’hypothèse
nulle peut être rejetée. Sinon, elle ne sera pas rejetée.
Dans notre exemple, les scores des dix étudiants de l’échantillon sont

19 , 18 , 16 , 20 , 21 , 24 , 23 , 18 , 19 , 17 .

On a xobs = 19.5 . Cette valeur dépasse le seuil critique de 18.995. L’hypothèse nulle
est donc rejetée. On admet donc que le médicament a un effet positif sur la mémoire.
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Dans ce contexte, on peut interpréter la valeur α = 0.05 . On peut en effet expliquer


les résultats du test de deux façons :

– H0 est vraie; nous avons donc été particulièrement malchanceux et nous sommes
tombés par hasard sur un échantillon particulièrement improbable : par exemple
dix étudiants qui, sans faire appel au médicament, bénéficient d’une meilleure
mémoire que la moyenne.

– H0 est fausse; il n’est donc pas surprenant de trouver une valeur aussi grande
de X .

On optera pour la seconde explication, la plus plausible. Il nous reste cependant un


léger doute : il reste possible que la première explication soit la bonne. La conclusion
est valable avec un risque d’erreur maximum de 5 %.

Calcul de la p-valeur :

On peut également résoudre ce test en utilisant la p-valeur.


L’avantage de la p-valeur est qu’elle fournit une idée précise du risque d’erreur qu’on
encourt en rejetant H0 alors que H0 est vraie, contrairement au test classique qui ne donne
pas cette valeur précise mais fixe arbitrairement la valeur de l’erreur maximum admise.
Dans notre exemple, la valeur observée de X vaut 19.5 . On doit donc calculer
 
19.5 − 17.683
PH0 (X ≥ 19.5) = PH0 Z ≥ √ = P (Z ≥ 2.27) = 0.0116 .
0.64
La p-valeur est égale à 0.0116 < 0.05 .
On rejette donc H0 au niveau α = 0.05 . Le risque d’erreur que l’on commet, c’est-à-dire
la probabilité d’avoir pris une décision fausse, est égal à 0.0116 .

Remarques :
1. Prenons un autre échantillon de dix étudiants et supposons que le score moyen est
de xobs = 18.2 objets reconnus. On a

PH0 (X ≥ 18.2) = P (Z ≥ 0.646) = 0.25785 > 0.05 .

Donc, bien que 18.2 > µ0 = 17.683 , on ne rejettera pas H0 . Il y a ici plus d’une
chance sur quatre de rencontrer un échantillon d’étudiants qui obtiennent un tel
résultat même si le médicament n’est pas utilisé.
On conclura donc que le médicament n’a pas d’effet.
§ VI. L’estimation par intervalle – Les tests d’hypothèses

2. Dans notre exemple, si on résoud le test d’hypothèses en calculant explicitement la


région critique, la règle de décision pourra se résumer de la façon suivante :

rejeter H0 si xobs ≥ k ,

accepter H0 si xobs < k ,

où la constante k est déterminée en fonction du niveau du test

α = PH0 (X ≥ k) .

On peut visualiser ces éléments sur le graphe de la distribution d’échantillonnage de


X .

Région d'acceptation Région de rejet


H0 accepté H1 accepté

α
X

µ0 = 17.68

Figure VI.2 –.

2.2 Tests uni- et bi-directionnels

Dans l’exemple précédent, nous avons, a priori, supposé que le score moyen des indi-
vidus ayant pris le médicament était supérieur au score moyen des étudiants n’ayant pas
pris le médicament; nous nous sommes donc intéressés à la surface de la partie droite de la
distribution d’échantillonnage de X . Il s’agissait d’un test unidirectionnel, la direction
de l’hypothèse alternative ayant été spécifiée.
Dans beaucoup de cas, cependant, l’expérimentateur s’intéressera seulement à une
différence possible sans a priori concernant la direction de cette différence. Le test sera
§ VI. L’estimation par intervalle – Les tests d’hypothèses

alors bi-directionnel, et le niveau α sera réparti de manière équivalente entre les deux
extrémités de la distribution d’échantillonnage.

Les différents tests possibles sont représentés ci-dessous :

a) H0 : µ = µ0 ,

HA : µ > µ 0 .

1-α

Figure VI.3 –.

On rejette H0 pour de “grandes” valeurs de xobs , c’est-à-dire si xobs ≥ k où k est


défini par
PH0 (X ≥ k) = α .
On parlera ici de test unilatéral à droite. La direction de la règle de rejet reprend
celle de l’alternative.

b) H0 : µ = µ0 ,

HA : µ < µ 0 .
On rejette H0 pour de “petites” valeurs de xobs , c’est-à-dire si xobs ≤ k où k est
défini par
PH0 (X ≤ k) = α .
On parlera ici de test unilatéral à gauche. La direction de la règle de rejet reprend
celle de l’alternative.
§ VI. L’estimation par intervalle – Les tests d’hypothèses

1-α
α

Figure VI.4 –.

c) H0 : µ = µ0 ,

H1 : µ 6= µ0 .
On rejette H0 pour de “grandes” ou de “petites” valeurs de xobs , c’est-à-dire si
xobs ≤ k1 ou si xobs ≥ k2 où k1 et k2 sont définis par
α α
PH0 (X ≤ k1 ) = et P H 0 (X ≥ k 2 ) = ·
2 2

1-α

α/2
α/2

Figure VI.5 –.

Ici, le niveau α sera réparti de manière équivalente entre les deux extrémités de la
distribution d’échantillonnage.

Ces tests peuvent également être résolus à partir du calcul de la p-valeur.


§ VI. L’estimation par intervalle – Les tests d’hypothèses

2.3 Erreurs de première et de deuxième espèces

Dans un test statistique, deux types d’erreurs peuvent être commises :


1. Rejeter H0 , alors que H0 est vraie.
Cette erreur est appelée “erreur de type I”. La probabilité de cette erreur est notée
α.
Dans l’exemple précédent, la p-valeur donne la probabilité de l’erreur de type I :

PH0 (X ≥ 19.5) = 0.0116 .

Par contre, si on effectue un test d’hypothèses en recherchant la région critique, on


fixe a priori un niveau d’erreur de type I maximum admis (généralement 5 %, ou
1 %).

2. Accepter H0 alors que HA est vraie.


Cette erreur est appelée “erreur de type II”.
La probabilité de cette erreur est notée β .

Un bon test est celui qui minimise ces deux erreurs, mais pour une taille d’échantillon
donnée, diminuer une erreur augmente généralement l’autre. On peut cependant réduire
simultanément α et β en augmentant la taille de l’échantillon.
Pour mieux comprendre la philosophie sous-jacente aux erreurs, prenons un exemple
de la vie courante. Imaginons une cour d’assises. Pour un accusé, il y a deux hypothèses
possibles : coupable ou innocent. Il existe des solutions qui minimisent une des deux erreurs,
c’est de condamner ou d’acquitter tout le monde.
Pratiquement, on utilise le principe du droit Napoléonien qui dit qu’il vaut mieux cent
coupables en liberté qu’un innocent en prison. L’hypothèse nulle est alors bien définie :
l’accusé est présumé innocent.
L’erreur de type I consiste à condamner un innocent. L’erreur de type II consiste à
innocenter un coupable.
On considère toujours que l’erreur de type I est la plus grave et on effectuera un test
en bornant la probabilité de cette erreur par α (en général, on prendra α = 0.05 ou 0.01 ).

2.4 Test sur le paramètre p d’une loi binomiale

Les problèmes d’inférence concernant la fréquence de réalisations d’un événement sont


courants en expérimentation scientifique, mais aussi dans la vie quotidienne. Les rapports
scientifiques, les journaux, la publicité font état chaque jour de statistiques donnant soit
§ VI. L’estimation par intervalle – Les tests d’hypothèses

le taux de mortalité due à la tuberculose ou au cancer, soit le pourcentage de réussite à


l’université, soit encore les chances de succès d’un candidat aux élections présidentielles.
Le modèle est généralement celui d’une loi binomiale. On répète n fois une expérience
élémentaire dont la probabilité de succès est p , et on s’intéresse au nombre X (effectif)
ou à la proportion Xn (fréquence) de succès.

Nous avons examiné précédemment en détail un exemple de comparaison d’une pro-


portion à une valeur théorique.
Une valeur p0 est préalablement posée, et l’hypothèse nulle est

H0 : p = p 0 .

L’alternative peut, suivant les cas, s’exprimer sous une des formes

HA : p < p 0 ,
HA : p > p 0 ,
HA : p 6= p0 .

L’expérimentation consiste à répéter n fois l’expérience élémentaire et à noter le nombre


X de succès. En vertu de l’hypothèse nulle

X est Bi(n,p0 ) .

Il y aura rejet de l’hypothèse nulle lorsque la p-valeur sera inférieure à un seuil que l’on se
sera fixé.
PH0 (X ≤ xobs ) ≤ α si HA : p < p0 ,

PH0 (X ≥ xobs ) ≤ α si HA : p > p0 ,




PH0 (X ≤ xobs ) ≤ α/2 
si HA : p 6= p0 .

ou PH0 (X ≥ xobs ) ≤ α/2 
Le test peut se réaliser de deux façons différentes, suivant que la variable aléatoire peut
ou ne peut pas être approximée par une variable aléatoire Normale.

2.4.1. Test basé sur la distribution binomiale


§ VI. L’estimation par intervalle – Les tests d’hypothèses

Exemple : dans une maternité, on a enregistré un jour la naissance de 9 garçons et de


16 filles. Peut-on conclure, au niveau α = 0.05 , que la fréquence de naissances de garçons
est inférieure à 0.5?
Les hypothèses sont

H0 : p = 0.5 ,
HA : p < 0.5 .

Si H0 est vraie, le nombre X de naissances mâles sur 25 naissances est une variable aléatoire
Bi(25,0.5) . On trouve immédiatement dans les tables que

PH0 (X ≤ 9) = 0.1148 .

On voit que cette probabilité (la p-valeur) est supérieure à α = 0.05 et rien ne permet donc
de conclure que la probabilité de naissance d’un garçon est inférieure à 0.5 .

2.4.2. Test basé sur la distribution Normale

Lorsque n est grand, et p voisin de 0.5 , nous avons vu qu’une variable aléatoire Bi(n,p)
pouvait être approximée par une variable aléatoire N (n p,n p q) . On a vu que cette
approximation est satisfaisante pour autant que n p ≥ 5 et n q ≥ 5 .

Exemple : un sociologue affirme que la moitié de la population belge est favorable au


travail à temps partiel. L’examen de 1000 personnes révèle que 460 d’entre elles y sont
favorables. Ce sociologue a-t-il raison?
Les hypothèses sont :

H0 : p = 0.5 ,
HA : p < 0.5 .

Le nombre X de personnes favorables au travail à temps partiel peut être approximé par
une variable aléatoire N (n p,n p q) . D’après l’hypothèse nulle

X est N (500,250) .

On rejettera H0 au niveau α si la p-valeur est inférieure à α , c’est-à-dire si PH0 (X ≤


460) ≤ α .
§ VI. L’estimation par intervalle – Les tests d’hypothèses

Choisissons α = 0.05 . On a
 
460−500
PH0 (X ≤ 460) = P Z ≤ √
250

= P (Z ≤ −2.53)
= 1 − P (Z ≤ 2.53)
= 0.0057 < 0.05 .

On rejette donc H0 , au niveau α = 0.05 . On peut donc affirmer que la proportion de


personnes favorables au travail à temps partiel dans la population belge est inférieure à
0.5 .

2.5 Exemples
1. Une association de consommateurs teste le contenu exact de boı̂tes de petits pois.
Le poids net égoutté annoncé sur l’étiquette est de 250 gr. Sachant que dans ce
genre de situation, l’écart-type pour une boı̂te est de 2 % du poids, soit 5 gr, quelles
conclusions tirer d’un échantillon de 120 boı̂tes donnant une moyenne observée de
249 gr?

Solution : il semble logique de considérer comme hypothèse nulle : “le poids an-
noncé est correct”, et comme hypothèse alternative : “le poids réel est inférieur au
poids annoncé”, c’est-à-dire


 H0 : µ = 250 ,

 HA : µ < 250 .

Résolvons cet exercice de deux manières :

(a) Calculons la p-valeur

!
249 − 250
PH0 (X ≤ 249) = P Z≤
√5
120

= P (Z ≤ −2.19) = 0.01426.

Comme 0.01426 < 0.05 , on rejettera H0 au niveau α = 0.05 .


§ VI. L’estimation par intervalle – Les tests d’hypothèses

(b) Calculons la région critique, c’est-à-dire la zone de rejet de H0

Fixons α = 0.05 .
La zone de rejet est calculée par

PH0 (X ≤ k) = 0.05 ,

c’est-à-dire !
k − 250
P Z≤ = 0.05 .
√5
120

Les tables de la loi N (0,1) nous donnent

k − 250
= −1.65
√5
120

et finalement
1.65 × 5
k = 250 − √ = 249.25 .
120
La règle est de rejeter H0 si xobs ≤ 249.25 .
Comme xobs = 249 , on rejettera donc H0 au niveau α = 0.05 .

Conclusion : chacun des deux tests conduit au rejet de H0 . Ceci ne veut pas
dire que ce rejet soit significatif au sens commun du terme. On peut reprocher au
producteur une certaine “mesquinerie” qui consiste à remplir les boı̂tes un petit peu
moins (1 gr par échantillon) que le poids annoncé. Mais, malgré la significativité
statistique, il serait difficile de crier à la fraude.

2. On veut tester l’hypothèse qu’en Belgique, les filles représentent environ 52 % des
naissances pour 48 % de garçons. Formellement, si p représente la proportion de filles,
nous écrirons H0 : p = 0.52 et HA : p 6= 0.52 . Imaginons que pour dix naissances un
jour donné dans une maternité, on observe une fille.
La p-valeur correspond à la probabilité d’avoir 0 ou 1 “succès” pour dix naissances,
pour une probabilité de “succès” de 0.52 , soit

0
PH0 (X ≤ 1) = C10 0.520 0.4810 + C10
1
0.521 0.489 = 0.00768 .

0.0078 < 0.025. Donc on rejette H0 au niveau α = 0.05 et on conclut que p 6= 0.52.
Chapitre VII

Les tests du chi-carré

1. Fréquences observées – Fréquences théoriques

Comme nous l’avons déjà vu précédemment, les résultats de l’échantillonnage ne cor-


respondent pas toujours aux résultats que laisse prévoir le calcul des probabilités. Par
exemple, si on lance 120 fois un dé équilibré, on s’attend théoriquement à obtenir 20 fois
le chiffre 1 , 20 fois le chiffre 2 , . . . , 20 fois le chiffre 6 .
Ces effectifs, que nous appellerons  effectifs théoriques , peuvent être présentés
sous la forme d’un tableau :

Résultat 1 2 3 4 5 6

Effectifs théoriques 20 20 20 20 20 20

Tableau VII.1 –.

Notons Ei l’événement  on obtient le chiffre i  et ti l’effectif correspondant. Le


Tableau VII.1 prendra la forme générale

Résultat E1 E2 E3 E4 E5 E6

Effectifs théoriques t1 t2 t3 t4 t5 t6

Tableau VII.2 –.

Dans la pratique, il est rare que l’on obtienne exactement ces résultats.
§ VII. Les tests du khi-deux

Supposons que l’on obtienne les effectifs suivants, appelés  effectifs observés  et
notés Oi , que nous présentons directement dans les Tableaux VII.3 et VII.4.

Résultat 1 2 3 4 5 6

Effectifs observés 14 16 28 30 18 14

Tableau VII.3 –.

Résultat E1 E2 E3 E4 E5 E6

Effectifs observés O1 O2 O3 O4 O5 O6

Tableau VII.4 –.

Les effectifs observés (Tableau VII.3) diffèrent-ils significativement des effectifs théoriques
(Tableau VII.1) ? Doit-on conclure que le dé n’est pas équilibré? Nous allons répondre à
cette question en utilisant un test d’hypothèses.

2. Test du khi-deux d’ajustement

a) Le test

On considère une population de N individus partagés en k catégories E1 , · · · , Ek .

Posons pi = P (Ei ) (i = 1, · · · , k) .

On veut tester l’hypothèse

H0 : p1 = p10 et ··· et pk = pk0

contre l’alternative

H1 : p1 6= p10 ou ··· ou pk 6= pk0


P
k
où les valeurs pi0 sont telles que pi0 = 1 .
i=1
§ VII. Les tests du khi-deux

b) La statistique du test

Pour effectuer ce test, considérons un E.A.S. de taille n.


Notons ni l’effectif observé associé à la catégorie Ei (i = 1, · · · ,k) .
L’effectif théorique correspondant (en supposant H0 vérifiée) est donné par ti = npi0 .

Nous allons devoir trouver une statistique à partir de laquelle nous pourrons réaliser
notre test d’hypothèses, et qui nous donnera une mesure globale de la déviation des
effectifs observés par rapport aux effectifs théoriques.

La première statistique qui nous vient à l’esprit pour mesurer globalement la déviation
entre les effectifs observés et les effectifs théoriques, est
k
X k
X
(Oi − ti ) = (ni − npi0 ).
i=1 i=1

Malheureusement cette somme est toujours nulle.

Nous considérerons plutôt la statistique suivante, appelée statistique du khi-deux


(ou chi-carré), que nous noterons χ2 :

Xk Xk
2 (Oi − ti )2 (ni − npi0 )2
χ = = .
i=1
ti i=1
npi0

– Si χ2 = 0 , les effectifs observés sont égaux aux effectifs théoriques;


– Si χ2 > 0 , les deux distributions sont différentes;
– Plus la valeur de χ2 est grande, plus la différence entre les deux distributions
est grande.

χ2 mesure la distance entre le tableau observé (ni ) et le tableau théorique obtenu


sous l’hypothèse H0 .

Distribution de la statistique du test

Si n ≥ 30 et ni ≥ 5 , ∀i , alors on peut montrer que, si H0 est vraie,


k
X k
X
(Oi − ti )2 (ni − npi0 )2
χ2 = = ≈ χ2k−1 .
i=1
ti i=1
npi0

Nous noterons alors cette V.A. χ2k−1 .


§ VII. Les tests du khi-deux

c) Règle de décision

- Région critique

On rejette H0 , au niveau α, si la valeur observée de la variable aléatoire


χ2k−1 , notée χ2obs , est telle que χ2obs ≥ kα où kα est tel que

P (χ2k−1 ≥ kα ) = α

On a

P (χ2k−1 ≥ kα ) = α ⇔ P (χ2k−1 < kα ) = 1 − α ⇔ kα = χ2k−1,1−α

où χ2k−1,1−α est le quantile d’ordre k − 1 de la variable aléatoire chi-carré à


n − 1 degrés de liberté.

La région critique est donnée par W = {(n1 , · · · ,nk ) : χ2obs ≥ χ2k−1,1−α } .

- p-valeur

On rejette H0 , au niveau α , si P (χ2k−1 ≥ χ2obs ) ≤ α.

d) Application à notre exemple

1 1 1
H0 : p1 = 6
, p2 = 6
, . . . , p6 = 6
,
1 1 1
H1 : p1 6= 6
, ou p2 6= 6
, ou . . . , ou p6 6= 6
,

X6 6
(Oi − ti )2 X (ni − n pi0 )2
χ25 = = ,
i=1
t i i=1
n p i0

(14 − 20)2 (16 − 20)2 (28 − 20)2 (30 − 20)2 (18 − 20)2 (14 − 20)2
χ2obs = + + + + +
20 20 20 20 20 20
= 12.8 .

- Calcul de la région critique

χ2k−1,1−α = χ25,0.95 = 11.1


Comme χ2obs = 12.8 > χ25,0.95 , on rejette H0 au niveau α = 0.05 .
§ VII. Les tests du khi-deux

- Calcul de la p-valeur

PH0 (χ25 ≥ 12.8) = 1 − PH0 (χ25 ≤ 12.8) = 1 − 0.975 = 0.025 < 0.05
On rejette donc H0 au niveau α = 0.05 .

Si le dé est équilibré ( H0 vraie), en moyenne seulement 2.5% des échantillons


de taille 120 conduiront à une valeur de χ25 supérieure ou égale à 12.8 , ce qui
est relativement peu.

On conclut donc, au niveau α = 0.05 , que le dé n’est pas équilibré.

Remarque : quelle conclusion aurions-nous tiré si nous avions choisi le niveau α =


0.01?

Le nombre de degrés de liberté, que nous noterons d , est déterminé de la manière


suivante :
d=k−1
où k est le nombre de  cases , ou d’événements intervenant dans le Tableau VII.1.

Remarques :
1. Si, pour calculer les effectifs théoriques, on doit estimer m paramètres de la popula-
tion à partir de statistiques d’échantillonnage, le nombre de degrés de liberté sera

d=k−1−m.
P
6
(Oi −ti )2
2. ti
aura approximativement une distribution chi-carré si tous les effectifs
i=1
théoriques sont au moins égaux à cinq (ce qui est le cas dans notre exemple).

3. On a toujours
k
X k
X
Oi = ti = n
i=1 i=1
où n est le nombre total d’observations.

3. Ajustement à une distribution binomiale

Soient Y une variable aléatoire binomiale de paramètres k et p :

Y ∼ Bi(k,p) ,
§ VII. Les tests du khi-deux

et les événements

A0 = {Y = 0} , A1 = {Y = 1} , · · · , Ak = {Y = k} .

Le problème qui se pose n’est pas d’effectuer un test sur le paramètre p , mais d’examiner
si la distribution binomiale dans son entièreté s’applique au phénomène étudié.

Voici un exemple simple : on s’intéresse au nombre Y de garçons dans une famille de


cinq enfants, et on suppose que Y est une variable aléatoire Bi(5,p) . Il se peut cependant
que certaines conditions posées dans le modèle de la distribution binomiale soient violées;
on peut mettre en doute, par exemple, l’indépendance des naissances successives, ce qui
aurait comme conséquence que la proportion réelle de familles de cinq garçons est plus
élevée que celle prévue par distribution binomiale.

Les hypothèses qu’on se propose d’étudier sont :


H0 : le nombre de garçons dans les familles de cinq enfants est une va-
riable aléatoire binomiale;

H1 : le nombre de garçons dans les familles de cinq enfants n’est pas une
variable aléatoire binomiale.

L’expérience consiste à examiner n familles de cinq enfants, et à noter le nombre


O0 ,O1 , · · · ,O5 de familles ayant 0,1, · · · ,5 garçons.
Les effectifs théoriques sont donnés par la distribution binomiale

t0 = n p0 = n C50 p0 q 5 ,
t1 = n p1 = n C51 p1 q 4 ,
..
.
t5 = n p5 = n C55 p5 q 0 ,

où p0 = P (Y = 0) , p1 = P (Y = 1) ,. . . , p5 = P (Y = 5) .
La statistique à calculer pour éprouver H0 est

Xk
(Oi − ti )2
χ2k−1 =
i=0
ti

avec (k − 1) degrés de liberté si p est connu.


§ VII. Les tests du khi-deux

Exemple : l’examen de 320 familles de 5 enfants s’est traduit par la distribution du


Tableau VII.5, où Y désigne le nombre de garçons.
Le nombre de garçons est-il distribué suivant une distribution binomiale de paramètre
p = 12 ?

Résultat (nombre de garçons) 0 1 2 3 4 5

Effectifs observés Oi 8 40 88 110 56 18

Tableau VII.5 –.

Solution :
– Calculons les effectifs théoriques

Y est la variable aléatoire : nombre de garçons dans une famille de 5 enfants.



Sous H0 , Y ∼ Bi 5, 21 . Par conséquent,

1 0

1 5
PH0 (Y = 0) = C50 2 2
= 1
32

1 5
PH0 (Y = 1) = C51 2
= 5
32

1 5
PH0 (Y = 2) = C52 2
= 10
32

1 5
PH0 (Y = 3) = C53 2
= 10
32

1 5
PH0 (Y = 4) = C54 2
= 5
32

1 5
PH0 (Y = 5) = C55 2
= 1
32
·

Les effectifs théoriques sont donnés par

ti = 320 × PH0 (Y = i) .

Nous obtenons le tableau suivant :

– Calculons la statistique du χ2
§ VII. Les tests du khi-deux

Résultat (nombre de garçons) 0 1 2 3 4 5

Effectifs théoriques ti 10 50 100 100 50 10

Tableau VII.6 –.

X5
(Oi − ti )2
χ25 =
i=0
ti

(8 − 10)2 (40 − 50)2 (88 − 100)2 (110 − 100)2


χ2obs = + + +
10 50 100 100

(56 − 50)2 (18 − 10)2


+ +
50 10
= 12 .

– Effectuons le test
1) Calcul de la p-valeur:

PH0 (χ25 ≥ 12) = 1 − PH0 (χ25 ≤ 12) < 0.05 .

On rejette donc H0 au niveau α = 0.05 .


2) Calcul de la région critique :
On rejette H0 , au niveau α = 0.05 , si χ2obs ≥ χ26−1,0.95 .
On trouve, dans les tables : χ25,0.95 = 11.1 < 12 .
On rejette H0 au niveau α = 0.05 ; on a un risque de se tromper de 5% maximum.

4. Test du khi-deux d’indépendance entre deux


variables

a) Le test

Supposons que dans une population chaque individu possède deux caractères Y et
X dont les modalités respectives sont A1 , · · · ,Ar et B1 , · · · ,Bs .
§ VII. Les tests du khi-deux

Ces caractères peuvent-ils être considérés comme statistiquement indépendants?

On testera donc les hypothèses

H0 : les variables X et Y sont indépendantes


H1 : les variables X et Y ne sont pas indépendantes

b) Statistique du test

Appelons nij le nombre d’individus possédant la modalité Ai du caractère Y et la


modalité Bj du caractère X .

Les variables X et Y sont indépendantes

ssi ∀i,j : fij = fi• f•j

ni• n•j
ou encore ssi ∀i,j : nij = .
n
On souhaite obtenir une statistique qui mesure la distance entre le tableau observé
et le tableau  théorique  (obtenu sous l’hypothèse H0 que les variables X et Y
sont indépendantes).

On peut montrer que, sous H0 ,


Xr X s r s n n
2 (Oij − tij )2 X X (nij − i•n •j )2
χ = = ni• n•j ≈ χ2(r−1)(s−1)
i=1 j=1
tij i=1 j=1 n

c) Règle de décision

- Région critique

On rejette H0 , au niveau α , si χ2obs ≥ χ2(r−1)(s−1),1−α .

On a alors W = {(n11 , · · · ,nrs ) : χ2obs ≥ χ2(r−1)(s−1),1−α } .

- p-valeur

On rejette H0 , au niveau α ,
si P (χ2(r−1)(s−1) ≥ χ2obs ) ≤ α.
§ VII. Les tests du khi-deux

d) Exemple 1

Le tableau ci-dessous reprend la répartition des électeurs d’une ville, en fonction


de leur opinion politique d’une part (Parti A, Parti B) , et du niveau de leur
salaire d’autre part (élevé, moyen, faible).

Salaire
élevé moyen faible

Parti A 15 35 10 60
Parti B 5 15 20 40

20 50 30 100

Question : les variables X (niveau de salaire) et Y (opinion politique) sont-elles


indépendantes? Nous aurons donc les hypothèses suivantes :

H0 : les variables X et Y sont indépendantes,

H1 : les variables X et Y ne sont pas indépendantes.

Le Tableau ci-dessus nous est familier. Il s’agit d’un tableau de contingence. La


variable qualitative X a trois modalités ; la variable Y a deux modalités.

- Le tableau de contingence obtenu sous l’hypothèse d’indépendance (tableau


théorique) est

Niveau
élevé moyen faible

Parti A 12 30 18 60

Parti B 8 20 12 40

20 50 30 100
§ VII. Les tests du khi-deux

Par exemple,
n1• n•1 60 × 20
n011 = = = 12 ,
n 100
n1• n•2 60 × 50
n012 = = = 30 ,
n 100
..
.

- Calculons la statistique du chi-carré :

(15−12)2 (35−30)2 (10−18)2 (5−8)2 (15−20)2 (20−12)2


χ2obs = 12
+ 30
+ 18
+ 8
+ 20
+ 12
= 12.85.

Le nombre de degrés de liberté est égal à: (r-1)(s-1)= (2-1)(3-1) = 2.

- Calcul de la région critique : χ22,0.95 = 5.99 .

Puisque χ2obs > χ22,0.95 , il y a rejet de H0 .


Au niveau 0.05 , on conclut que les variables X et Y ne sont pas indépendantes.

- Calcul de la p-valeur: PH0 (χ25 ≥ 12.85) = 1 − PH0 (χ25 ≤ 12.85) < 0.05 .

On rejette donc H0 au niveau α = 0.05 .

Conclusion

Au niveau α = 0.05 , il y a association entre les variables  opinion politique  et


 niveau de revenu .

Exemple 2 : afin de déterminer s’il y a indépendance entre le groupe sanguin et le


sexe, on a examiné 976 individus prélevés au hasard. Les observations se répartissent
comme suit :

Les hypothèses sont :


H0 : il y a indépendance entre le sexe et le groupe sanguin,

H1 : il n’y a pas d’indépendance entre le sexe et le groupe sanguin.


§ VII. Les tests du khi-deux

Sexe
Groupe sanguin Hommes Femmes Total
AB 25 15 40
A 215 207 422
O 200 194 394
B 60 60 120
Total 500 476 976

Tableau VII.7 –. Effectifs de 976 individus classés par sexe et par groupe sanguin.

Étant donné H0 , on peut calculer les effectifs théoriques.


Par exemple,
n1• n•1 40 × 50
n011 = = ' 20.49 ,
n 976
n1• n•2 422 × 500
n012 = = ' 216.19 ,
n 976
..
.

En procédant de même pour tous les cas, on obtient la table des effectifs théoriques :

Sexe
Groupe sanguin Hommes Femmes Total
AB 20.49 19.51 40
A 216.19 205.81 422
O 201.84 192.16 394
B 61.48 58.52 120
Total 500 476 976

Tableau VII.8 –. Effectifs de 976 individus classés par sexe et par groupe sanguin.
§ VII. Les tests du khi-deux

On calcule alors la valeur de la statistique χ2 :

(25 − 20.49)2 (60 − 58.52)2


χ2obs = +···+ = 2.154 ,
20.49 58.52
et le nombre de degrés de liberté :

(r − 1)(s − 1) = (4 − 1)(2 − 1) = 3 .

– Calcul de la région critique :


La table de χ2 donne, pour α = 0.05 et degré de liberté =3 :

χ23,0.95 = 7.81 .

Puisque χ2obs < χ23,0.95 , il y a non rejet de H0 .

– Calcul de la p-valeur :

PH0 (χ23 ≥ 2.154) = 1 − PH0 (χ23 ≤ 2.154) > 0.05 .

On ne rejette donc pas H0 au niveau de signification α = 0.05 .

En conclusion, ces observations ne permettent pas d’affirmer qu’il y a association


entre le groupe sanguin et le sexe.
Statistique I
Syllabus d’exercices
Partie II
Chapitre V

Échantillonnage – Distributions
d’échantillonnage

1. Exercices résolus
Exercice 1
Une population est caractérisée par une moyenne égale à 200 et un écart type égal à 50 .
Supposons qu’un échantillon aléatoire simple de taille 100 soit sélectionné et que x soit
utilisé comme estimation de µ .
Quelle est la probabilité que la moyenne d’échantillonnage s’écarte au plus de ±5 de la
moyenne de la population?

Solution : par le théorème central limite :


 
2 500
X ≈ N 200, .
100

D’où

p = P (|X − µ| ≤ 5)
= P (µ − 5 ≤ X ≤ µ + 5)
= P (195 ≤ X ≤ 205)
= P (X ≤ 205) − P (X ≤ 195) ,
§ V. Échantillonnage – Distributions d’échantillonnage

 
205 − 200
P (X ≤ 205) = P Z≤ = P (Z ≤ 1)
5
= 0.8413 ,
 
195 − 200
P (X ≤ 195) = P Z ≤ = P (Z ≤ −1)
5
= P (Z ≥ 1) = 1 − P (Z ≤ 1)
= 0.1587 ,

p = 0.8413 − 0.1587 = 0.6826 .

Exercice 2
L’Institut National de Statistique révèle, sur base du dernier recensement, que 17% des
ménages dépensent plus de 100 Euros par semaine en épicerie.
On extrait de la population un échantillon aléatoire simple de 800 ménages.

(a) Quelle est la distribution d’échantillonnage de p̂, la proportion des ménages de


l’échantillon qui dépensent plus de 100 Euros par semaine en épicerie?
(b) Quelle est la probabilité pour que la proportion d’échantillonnage s’écarte de ±0.02
de la proportion de la population?

Solution :
(a) Soit X le nombre de ménages dans l’échantillon qui dépensent plus de 100 Euros en
épicerie.
X p(1 − p)
p̂ = , E(p̂) = p , var(p̂) = ,
n n
d’où

E(p̂) = 0.17 ,

(0.17)  (0.83)
var(p̂) = = 0.0001763 ,
800
p
σp̂ = var(p̂) = 0.0133 .

(b) p̂ suit une distribution Normale car

n p = 800 × 0.17 = 136 > 5 ,


§ V. Échantillonnage – Distributions d’échantillonnage

n (1 − p) = 800 × 0.83 = 664 > 5 ,


d’où
 
0.15 − 0.17 0.19 − 0.17
P (0.15 ≤ p̂ ≤ 0.19) = P ≤Z≤
0.0133 0.0133

= P (−1.50 ≤ Z ≤ 1.50)

= P (Z ≤ 1.50) − P (Z ≤ −1.50)

= P (Z ≤ 1.50) − [1 − P (Z ≤ 1.50)]

= 0.86638 .

2. Exercices supplémentaires
1. La distribution d’échantillonnage de la moyenne : faire une synthèse des différents
cas vus au cours.

2. Certains tubes fabriqués par une compagnie ont une durée de vie moyenne de 800
heures et un écart type de 60 heures. On suppose que la durée de vie de ces tubes
suit une distribution Normale.

(a) Calculer la probabilité qu’un tube pris au hasard ait une durée de vie moyenne
comprise entre 790 et 810 heures.
(b) Calculer la probabilité qu’un échantillon de 36 tubes pris au hasard dans la
population ait une durée de vie moyenne comprise entre 790 et 810 heures.
(c) Comparer et expliquer les résultats obtenus dans les deux points précédents.

3. Les poids des colis reçus dans un grand magasin ont une moyenne de 300 kg et un
écart type de 50 kg. Quelle est la probabilité pour que 25 colis reçus au hasard et
chargés sur un monte-charge dépassent la limite de sécurité du monte-charge, qui est
de 8 200 kg?

4. Soit T une V.A. de Student à 15 degrés de liberté.


Calculer

(a) P (T ≤ 2.15)
(b) P (T = 2.15)
§ V. Échantillonnage – Distributions d’échantillonnage

(c) P (T ≤ 1.75)
(d) P (T ≥ 0)
(e) P (T > 1.75)

Représenter chacune des aires concernées sur un graphique.

5. (a) Donner la définition du quantile d’ordre α de la distribution de Student à n


degrés de liberté, et en donner une représentation graphique.
(b) Calculer le quantile d’ordre 0.95 d’une distribution de Student à 10 degrés de
libertés.
(c) Calculer le quantile d’ordre 0.05 d’une distribution de Student à 10 degrés de
libertés.
(d) Conclure.

6. Calculer le quantile d’ordre 0.975

(a) d’une distribution Normale centrée réduite.


(b) d’une distribution de Student à n degrés de liberté lorsque
i. n = 20 .
ii. n = 30 .
iii. n = 500 .
iv. n augmente indéfiniment.
(c) conclure.
Chapitre VI

Intervalles de confiance

1. Exercices résolus
Exercice 1
Un échantillon de 532 abonnés à Trends Tendances a révélé qu’un abonné passait, en
moyenne, 6.7 heures par semaine à consulter Internet et les services en ligne, avec un écart
type s0 égal à 5.8 heures.
Calculer un intervalle de confiance à 95% par le temps passé en moyenne par les abonnés
de Trends Tendances à utiliser Internet et les services en ligne.

Solution :

• Population : les abonnés à Trends Tendances.


V.A. associée à la population : X temps passé par les abonnés à consulter Internet
et les services en ligne.
Paramètre sur lequel porte l’inférence : E(X) = µ .

• Échantillon : 532 abonnés à Trends Tendances

x = 6.7heures , s0 = 5.8heures .
§ VI. Intervalles de confiance

• Calcul de l’intervalle :

Il s’agit d’un intervalle de confiance pour la moyenne d’une population quelconque,


de variance inconnue, dans le cas de grands échantillons :
 
s0 s0
Iα (µ) ≈ X − z1− 2 √ , X + z1− 2 √
α α
n n
 
5.8 5.8
I0.05 (µ) = 6.7 − 1.96 √ , 6.7 + 1.96 √
532 532

= [6.207,7.193]

Interprétation : si on prélève de la population des lecteurs de Trends Ten-


dances un très grand nombre d’échantillons de taille 532 , environ 95% d’entre eux
recouvriront la vraie valeur inconnue du paramètre µ .

Exercice 2
Lors d’un sondage Time/CNN, 814 adultes ont répondu à une série de questions sur leur
opinion quant à l’état des affaires aux États-Unis. Au total, 532 adultes ont répondu
 OUI  à la question :

 Pensez-vous que les choses aillent bien aux États-Unis en ce moment? 

(Time, 11 août 1997)

(a) Quelle est l’estimation ponctuelle de la proportion de la population d’adultes qui


pensent que les choses vont bien aux États-Unis?
(b) Au seuil de confiance de 90%, quelle est la marge d’erreur?
(c) Calculer l’intervalle de confiance à 90% pour la proportion de la population des
adultes qui pensent que les choses vont bien aux États-Unis?

Solution :
(a) Soit X la V.A. comptant le nombre d’adultes d’un échantillon de 814 adultes qui
pensent que les choses vont bien aux Etats-Unis.
X
Soit p̂ = n
.
532
Alors p̂ = = 0.6904 .
814
§ VI. Intervalles de confiance

(b) On peut supposer que X ∼ Bi (n,p).


Or n ≥ 30. Donc X peut être approchée par une loi N (np,npq).
Donc p̂ peut être approchée par une loi N (p, pq
n
p̂−p
) et √ p.q peut être approchée par une
n
loi N (0,1).
Ainsi la marge d’erreur, c’est-à-dire la demi-longueur de l’intervalle de confiance, sera
donnée par
r
p̂ q̂
E = z1− α2
n
q
= 1.645 0.6904 (1−0.6904)
814
= 0.0267 .

q
p̂ q̂
(c) Iα (p) = X̄ ± z1− α2 n

I0.1 (p) = 0.6904 ± 0.0267

= [0.6637,0.7171] .

2. Exercices supplémentaires
1. Les intervalles de confiance pour le paramètre µ d’une distribution Normale et pour
une proportion : faire une synthèse des différents cas vus au cours.

2. Le taux moyen de cholestérol mesuré sur un échantillon de 144 sujets choisis par
tirage au sort dans une population d’individus âgés de plus de cinquante ans est de
1985 cg . On suppose l’écart type de la mesure du taux de cholestérol connu dans
cette population, et égal à 50 cg .

(a) Donner une estimation par intervalle de confiance de la moyenne exacte du


taux de cholestérol dans cette population (prendre un niveau d’incertitude égal
à 0.05).
(b) Donner une interprétation de cet intervalle de confiance.
(c) Si le niveau d’incertitude avait été de 0.01 , l’intervalle de confiance aurait-il été
plus grand ou plus petit? Expliquer.

3. La moyenne des poids d’un échantillon représentatif de 100 étudiants des Facultés
§ VI. Intervalles de confiance

Universitaires est de 67.45 kg avec un écart-type s0 égal à 2.93 kg .

(a) Identifier la population concernée, ainsi que la variable aléatoire associée à cette
population.
(b) Déterminer un intervalle de confiance à 95 % pour estimer le poids moyen des
étudiants des Facultés Universitaires .
(c) Donner une interprétation de cet intervalle de confiance.

4. Une enquête a été faite en Belgique auprès d’un échantillon représentatif de 50 per-
sonnes de manière à avoir leur avis sur un projet du Gouvernement concernant l’envi-
ronnement. On constate que dans cet échantillon, 25 % des personnes sont favorables
à ce projet.

(a) Déterminer un intervalle de confiance pour la proportion de personnes favorables


à ce projet dans toute la population (prendre un niveau d’incertitude de 5 %).
(b) Donner une interprétation de cet intervalle de confiance.

5. Sur 100 dossiers pris au hasard dans un service de désintoxication pour fumeurs, on
relève que 35 personnes, après avoir suivi volontairement le traitement jusqu’au bout,
déclarent n’avoir pas récidivé.

(a) Donner une estimation de la proportion p de fumeurs de ce service de désintoxication


qui déclarent n’avoir pas récidivé.
(b) Trouver un intervalle de confiance pour p .
(c) Que peut-on déduire sur l’efficacité d’un tel traitement (on prendra un niveau
d’incertitude égal à 0.05).

6. Dans un échantillon aléatoire simple de 2 424 naissances, on a trouvé 1 270 garçons


et 1 154 filles.

(a) Donner une estimation du pourcentage de garçons à la naissance dans la popu-


lation.
(b) Donner un intervalle de confiance de ce pourcentage aux niveaux d’incertitude
de 5 pourcents et de 1 pourcent. Comparer les intervalles obtenus.
(c) Combien de naissances doit-on recenser pour connaı̂tre le pourcentage de garçons
dans la population, avec une précision égale à 0.05 pourcents, au niveau d’in-
certitude de 5 pourcents.
§ VI. Intervalles de confiance

7. Un institut de sondage a observé sur un échantillon de 1 600 personnes, 51 pourcents


d’intentions de vote en faveur du candidat X .
Peut-on assurer, avec un risque 5 pourcents de se tromper, que le candidat X sera
élu?

8. Un mareyeur livre des caisses de thon blanc à la conserverie. À la réception des colis,
le responsable a des doutes sur le poids affiché ; il prélève un échantillon de 16 caisses
dont il mesure en tonnes la moyenne et l’écart type : x̄ = 1.98 t ; s0 = 0.11 t .
Trouver un intervalle de confiance à 95 pourcents pour le poids moyen de ces caisses.
Sachant que le poids affiché est de 2 t , le mareyeur tient-il ses engagements?
(On suppose que le poids des caisses suit une distribution Normale.)

9. Supposons que la moyenne x̄ d’un échantillon aléatoire simple d’effectif 25, prélevé
dans une population N (µ, 6400) vaille 81.2 . Trouver un intervalle de confiance
pour µ au niveau de confiance 0.95 .

10. On suppose que le temps de mémorisation d’un texte par les étudiants d’une promo-
tion suit une distribution Normale. Un échantillon de 17 étudiants fournit les valeurs
observées suivantes : x̄ = 25 , s0 = 5 .
Trouver un intervalle de confiance pour le temps moyen de mémorisation µ de la
promotion.

11. Pour étudier un lot de fabrication de comprimés, on en prélève 10 au


hasard que l’on pèse. On obtient les résultats suivants (en centigrammes) :

81 84 83 80 85 86 85 83 84 80

On admet que le poids d’un comprimé suit une distribution Normale.

(a) Trouver un intervalle de confiance, au niveau d’incertitude 0.05 , pour la moyenne


du poids des comprimés du lot de fabrication considéré.
(b) Donner une interprétation de cet intervalle de confiance?

12. La durée d’écoulement d’un grand sablier est une variable aléatoire N (µ,σ 2 ) dont on
ne connaı̂t pas les paramètres. En le faisant fonctionner 10 fois, on obtient une durée
moyenne x̄ égale à 16 secondes, avec un écart-type s0 égal à 1 seconde.

(a) Donner une estimation ponctuelle du temps d’écoulement moyen du sablier.


§ VI. Intervalles de confiance

(b) Calculer un intervalle de confiance, au niveau d’incertitude 0.05 , pour le temps


d’écoulement moyen du sablier.
(c) Calculer un intervalle de confiance, au niveau d’incertitude 0.01 , pour le temps
d’écoulement moyen du sablier.
(d) Comparer les deux intervalles trouvés aux deux points précédents.
(e) Si on prenait un niveau d’incertitude égal à 0.1 , l’intervalle de confiance ob-
tenu serait-il plus petit ou plus grand que les intervalles trouvés ci-dessous ?
Expliquer.
(f) Supposons que l’on fasse fonctionner le sablier 20 fois, et que l’on obtienne
la même moyenne x̄ et le même écart-type s0 . Si on calcule un intervalle de
confiance au niveau d’incertitude 0.05 pour le temps d’écoulement moyen du
sablier, cet intervalle sera-t-il plus petit ou plus grand que l’intervalle trouvé au
point (b)? Expliquer.
Chapitre VI

Tests d’hypothèses

1. Exercice résolu
En février 2000, le prix moyen d’un voyage aller-retour par avion en Europe était de 258
Euros. Un échantillon aléatoire simple de 15 billets aller-retour par avion en Europe, vendus
au cours du mois de février 2001, a fourni les données suivantes sur les prix :

310 260 265 255 300 310 230 250 265 280 290 240 285 250 260

En utilisant un niveau de 5% , tester si le prix moyen d’un billet d’avion aller-retour


en Europe a augmenté de février 2000 à février 2001 (on suppose que le prix des billets
aller-retour par avion en Europe suit une distribution Normale).

Solution :

• Population : prix des voyages en avion aller-retour en Europe en février 2001.


V.A. Associée à la population : X , prix d’un voyage en avion aller-retour en
Europe en février 2001.
X ∼ N (µ,σ 2 ) .

• Échantillon : 15 prix de billets d’avion aller-retour en Europe en février 2001.


P
xi
xobs = = 270 ,
n
rP
0 (xi − x)2
s = = 24.78 .
n−1
§ VI. Tests d’hypothèses

• Test :
(a) H0 : µ = 258 ,
H1 : µ > 258 .
(b) Statistique du test : X .
Sous H0 :
X − µ0
s0
∼ tn−1 .

n

En effet, l’écart type σ est inconnu et n < 30.


(c) Règle de décision :
1. Région critique : on rejette H0 , au niveau α , si

s0
xobs ≥ µ0 + tn−1,1−α √ ;
n
on a :
xobs = 270 ,
s0 24.78
µ0 + tn−1,1−α √ = 258 + 1.761 √ = 269.3
n 15
Conclusion : xobs > 269.3; on rejette donc H0 au niveau α = 0.05 .
Le prix des billets d’avion aller-retour en Europe a augmenté de février 2000
à février 2001.
2. p-valeur : on rejette H0 , au niveau α , si p-valeur ≤ α :
!
X − µ0 270 − 258
PH0 (X ≥ xobs ) = PH0 s0
≥ 24.78
√ √
n 15

= PH0 (t14 ≥ 1.88)


= 1 − PH0 (t14 ≤ 1.88) < 0.05 .

car PH0 (t14 ≤ 1.88) > 0.95.

Conclusion : on rejette H0 au niveau α = 0.05 .


Le prix des billets d’avion aller-retour en Europe a augmenté.
§ VI. Tests d’hypothèses

2. Exercices supplémentaires
1. Test sur le paramètre µ d’une distribution Normale de variance σ 2 (connue).
Faire une synthèse des différents cas (alternatives unilatérale à gauche, unilatérale à
droite, bilatérale).

2. Un procédé de fabrication courant a produit des millions de tubes TV, dont la durée
de vie moyenne est de 1 200 heures, avec un écart type de 300 heures .
Un nouveau procédé, estimé meilleur par le bureau d’études, fournit un échantillon
de 100 tubes, avec une moyenne de 1 265 heures. On suppose l’écart type connu, égal
à 300 heures.
Tester l’hypothèse que le nouveau procédé est meilleur (au niveau de 0.05)

(a) en utilisant la région critique.


(b) en utilisant la p-valeur.

3. Un procédé de fabrication courant a produit des millions de tubes TV, dont la durée
de vie moyenne est de 1 200 heures, avec un écart type de 300 heures.
Un nouveau procédé, estimé moins bon par le bureau d’études, fournit un échantillon
de 100 tubes, avec une moyenne de 1 135 heures. On suppose l’écart type connu, égal
à 300 heures.
Tester l’hypothèse que le nouveau procédé est moins bon (au niveau de 0.05)

(a) en utilisant la région critique.


(b) en utilisant la p-valeur.

4. Une bibliothèque universitaire se demande si le nombre moyen d’ouvrages consultés


par les étudiants au cours d’une visite dans cette bibliothèque a augmenté. Dans le
passé une étude avait montré que cette moyenne s’établissait à 3 livres. Un échantillon
de 10 étudiants a permis de mesurer une moyenne de 4.1 livres consultés, avec un
écart type mesuré s0 égal à 1.897 .
On suppose que la variable aléatoire X , qui représente le nombre de livres consultés
par étudiant, suit une distribution Normale.
Au vu de ces résultats, peut-on conclure que le nombre moyen de livres consultés par
les étudiants a augmenté significativement?

Pour répondre à cette question,

(a) prendre un niveau de 1 pourcent et calculer la région critique du test ;


§ VI. Tests d’hypothèses

(b) prendre un niveau de 5 pourcents et calculer la p-valeur ;


(c) conclure.

5. Dans une expérience sur l’acuité visuelle, un chercheur a demandé à 49 individus


d’évaluer la distance d’un objet placé à 20 cm . On suppose ici que l’évaluation de
la distance par un individu suit une distribution Normale. Les résultats obtenus à
partir de ces 49 individus fournissent une valeur moyenne de 18.93 cm et un écart
type s0 = 2.82 cm .

(a) Au vu de ces résultats, peut-on conclure, au niveau de 0.01 , que les individus
ont de la difficulté à évaluer la distance d’un objet placé à 20 cm?
(b) Expliquer, d’une manière générale, la démarche effectuée dans le cadre d’un test
d’hypothèses.

6. Une association de consommateurs souhaite savoir si le poids exact du contenu des


boı̂tes de petits pois n’est pas inférieur au poids indiqué sur l’étiquette. Le poids net
égoutté annoncé sur l’étiquette est de 250 g. Sachant que dans ce genre de situation,
l’écart type pour le poids d’une boı̂te est de 2 % du poids, soit 5 g, quelles conclusions
tirer d’un échantillon de 120 boı̂tes donnant une moyenne observée de 249 g?

7. Le fabricant d’un médicament breveté affirmait qu’il était efficace à 90 pourcents


pour guérir une allergie en 8 heures. Dans un échantillon de 200 personnes atteintes
par cette allergie, on en a guéri 160 par le médicament.
Déterminer si l’affirmation du fabricant est légitime, au seuil de 1 pourcent.
Chapitre VII

Tests chi-carré

1. Exercices résolus
Exercice 1
On effectue une étude sur le développement de 80 villes dont on a constaté que l’extension
à partir du centre se faisait dans une direction géographique prioritaire. Le tableau suivant
donne, pour chaque direction, le nombre de villes pour lesquelles on a relevé l’extension
dans cette direction :

Direction N NE E SE S SO O NO
Nombre de villes 7 6 4 6 10 16 18 13

(a) On se fixe a priori un niveau α = 0.05 .


Ces données sont-elles compatibles avec l’hypothèse que l’extension d’une ville a les
mêmes chances de se faire dans n’importe quelle direction?
(b) Quel est le risque que l’on rend réellement en rejetant cette hypothèse?

Solution :
(a) Il s’agit d’un test chi-carré d’ajustement.
Soit E1 (respectivement E2 , · · · ,E8 ) l’événement  l’extension se fait dans la direc-
tion N  (respectivement NE , E , SE , S , SO , O , NO ).
Notons pi = p(Ei ) , i = 1, · · · ,8 .
L’hypothèse nulle exprimera que l’extension d’une ville a les mêmes chances de se
faire dans n’importe quelle direction :
1
H0 : p1 = p 2 = · · · = p 8 = ·
8
§ VII. Tests chi-carré

L’hypothèse alternative sera alors


1 1 1
H1 = p1 6= ou p2 6= ou ··· ou p8 6= .
8 8 8
Les effectifs théoriques (calculés sous l’hypothèse que H0 est vraie) sont tous égaux

1
× 80 = 10 .
8
Le tableau théorique sera donné par :

Direction N NE E SE S SO O NO
Nombre de villes 10 10 10 10 10 10 10 10

On calcule la distance entre le tableau théorique et le tableau observé :


8
X (ni − n pi )2
χ2obs =
i=1
n pi

(7 − 10)2 (6 − 10)2 (4 − 10)2 (6 − 10)2


= + + +
10 10 10 10

(10 − 10)2 (16 − 10)2 (18 − 10)2 (13 − 10)2


+ + + +
10 10 10 10

= 18.6 .

Le nombre de degré de liberté est 8−1 =7 .

1. Région critique :

Règle de décision : on rejette H0 , au niveau α = 0.05, si χ2obs ≥ χ27,0.95 .


Les tables donnent : χ27,0.95 = 14.1

χ2obs = 18.6 > 14.1 .

On rejette H0 au niveau α = 0.05 .

Conclusion : l’extension d’une ville n’a pas les mêmes chances de se faire dans
n’importe quelle direction (au niveau α = 0.05 ).
§ VII. Tests chi-carré

2. p-valeur :

Règle de décision : on rejette H0 , au niveau α , si p-valeur ≤ α .

PH0 (χ27 ≥ χ2obs ) = PH0 (χ27 ≥ 18.6)


= 1 − PH0 (χ27 ≤ 18.6)
≈ 1 − 0.99
≈ 0.01 < α = 0.05 .

On rejette H0 au niveau α = 0.05 .

(b) Le risque que l’on prend réellement en rejetant H0 est donné par la p-valeur. Ce
risque est donc voisin de 1% .

Exercice 2
On compare la qualité des sondages réalisés par deux instituts A et B en testant l’exactitude
de leurs prévisions durant une année. Les résultats sont les suivants :

Institut A Institut B
Nombre de prévisions exactes 83 105
Nombre de prévisions fausses 7 5

a) Formuler une hypothèse à tester et proposer un test.

b) Exécuter le test et conclure (on se fixe un niveau de 0.1 ).

c) Si on prend un niveau plus petit, la conclusion reste-t-elle toujours la même? Expli-


quer (ne pas faire de calculs).

Solution :

a) H0 : l’exactitude des prévisions est indépendante du choix de l’institut ;

H1 : l’exactitude des prévisions dépend du choix de l’institut.

Il s’agit d’un test chi-carré d’indépendance.


§ VII. Tests chi-carré

b) Le tableau observé est donné dans l’énoncé. On le complète en y indiquant les effectifs
marginaux :

Institut A Institut B
Nombre de prévisions exactes 83 (n11 ) 105 (n12 ) 188 (n1• )
Nombre de prévisions fausses 7 (n21 ) 5 (n22 ) 12 (n2• )
90 (n•1 ) 110 (n•2 ) 200 (n)

Les effectifs théoriques n0ij sont calculés sous l’hypothèse que H0 est vraie (hypothèse
d’indépendance) :
n1• × n•1 188 × 90
n011 = = = 84.6 ,
n 200
n1• × n•2 188 × 110
n012 = = = 103.4 ,
n 200
n2• × n•1 12 × 90
n021 = = = 5.4 ,
n 200
n2• × n•2 12 × 110
n022 = = = 6.6 .
n 200
Le tableau théorique est donné par :

Institut A Institut B
Nombre de prévisions exactes 84.6 103.4 188
Nombre de prévisions fausses 5.4 6.6 12
90 110 200

La distance entre le tableau théorique et le tableau observé est donnée par :


2 X 2
X (nij − n0ij )2
χ2obs =
i=1 j=1
n0ij

(83 − 84.6)2 (105 − 103.4)2 (7 − 5.4)2 (5 − 6.6)2


= + + +
84.6 103.4 5.4 6.6

= 0.917 .

Le nombre de degrés de liberté est 1 .

(a) Région critique :

Règle de décision : on rejette H0 , au niveau de 0.1 , si χ2obs > χ21,0.9 .


Les tables donnent :
χ21,0.9 = 2.71
§ VII. Tests chi-carré

et
χ2obs = 0.917 < 2.71 .

Conclusion : l’hypothèse n’est pas rejetée au niveau α = 0.1 .


Il y a donc indépendance entre l’exactitude des prévisions et le choix de l’institut.
Ici, le χ2obs est très petit. La différence de résultats entre les deux instituts n’est
pas du tout significative.
(b) p-valeur :

Règle de décision : on rejette H0 , au niveau α , si la p-valeur est inférieure à α .


On a

PH0 (χ21 ≥ χ2obs ) = PH0 (χ21 ≥ 0.917)


= 1 − PH0 (χ21 < 0.917) .

Conclusion : La p-valeur est comprise entre 0.3 et 0.4, donc supérieure à α = 0.1.
On ne rejette pas H0 au niveau α = 0.1 .

c) Plus le niveau du test est petit, moins facilement on rejette H0 . Comme on ne rejette
pas H0 au niveau α = 0.1, a fortiori on ne rejettera pas H0 à un niveau α plus petit.

2. Exercices supplémentaires
1. Soit X une V.A. chi-carré à 6 degrés de liberté. Calculer

(a) P (X ≤ 12.6)
(b) P (X ≥ 16.8)
(c) le quantile d’ordre 0.95 de la distribution de X
(d) le quantile d’ordre 0.99 de la distribution de X

2. Lors d’un sondage, les avis donnés par 404 électeurs sur les partis de la majorité et
de l’opposition sont repris dans le tableau suivant :

Favorables Opposés Indécis


Majorité 85 78 37
Opposition 118 61 25
§ VII. Tests chi-carré

Tester, au niveau de 0.05 , l’hypothèse nulle suivant laquelle il n’y a aucune différence
entre la popularité des partis de la majorité et la popularité des partis de l’opposition.

3. Dans une étude pour ses annonceurs, un groupe de presse a tiré au hasard un
échantillon de 100 lecteurs de chacun de ses trois principaux titres, avec les résultats
suivants :

Journal
Classe sociale A B C
Bas revenus 29 9 10
Petite bourgeoisie 47 57 49
Moyenne bourgeoisie 16 24 29
Grande bourgeoisie 8 10 12

Tester, au niveau 0.05 , l’hypothèse nulle suivant laquelle le choix d’un journal est
indépendant de la classe sociale des lecteurs.

4. Au départ d’une course de chevaux, il y a habituellement 8 positions, et la position


numéro 1 est la plus proche de la palissade intérieure. On pense qu’un cheval a plus
de chances de gagner quand il porte un numéro faible (c’est-à-dire qu’il est proche
de la palissade intérieure).
Les données de 144 courses sont présentées dans le tableau suivant :

Position de départ (numéro) 1 2 3 4 5 6 7 8


Nombre de victoires d’un cheval
29 19 18 25 17 10 15 11
ayant ce numéro

(a) Tester l’hypothèse suivant laquelle le nombre de victoires est le même, quelle
que soit la position de départ (prendre un niveau de 0.05 ).
(b) En vous servant de cet exemple, donner une interprétation du niveau de ce test.

5. Le tableau suivant reprend des données concernant le niveau des dépenses pour
l’achat de produits cosmétiques observées sur un échantillon de 500 femmes adultes
différentiées par leur statut professionnel.
§ VII. Tests chi-carré

Statut professionnel
Travail à Travail à
Dépenses par mois Sans profession
temps plein temps partiel
Moins de 500 Euros 30 20 60
Entre 500 et 1 000 Euros 55 60 65
Plus de 1 000 Euros 55 80 75

(a) Tester, au niveau de 5 pourcents, l’hypothèse nulle suivant laquelle le niveau


des dépenses est indépendant du statut professionnel des femmes.
(b) En vous servant de cet exemple, donner une interprétation du niveau de ce test.
(c) Si on avait pris un niveau de 1 pourcent, aurait-on rejeté plus facilement ou
moins facilement l’hypothèse nulle? Expliquer.

6. Parmi un groupe de malades qui se plaignent de ne pas bien dormir, certains ont
absorbé un somnifère sous la forme de cachets, d’autres ont absorbé des cachets de
sucre (tous pensaient qu’on leur administrait un somnifère). Après quoi on leur a
demandé si les cachets ont été efficaces. Le tableau suivant indique les différentes
réponses. Tester l’hypothèse qu’il n’y a aucune différence entre le somnifère et le
sucre au seuil de 0.05 .

ont bien dormi n’ont pas bien dormi


ont pris le somnifère 44 10
ont pris du sucre 81 35

Vous aimerez peut-être aussi