Vous êtes sur la page 1sur 11

ECHANTILLONNAGE

1. Introduction
La statistique est l’ensemble des méthodes scientifiques à partir desquelles on recueille, organise,
résume, présente et analyse des données, et qui permettent d’en tirer des conclusions et de
prendre des décisions judicieuses.

Exemple
Le responsable d’un atelier de fabrication cherche à vérifier si les pièces produites par une
machine sont conformes aux spécifications demandées par le client. Par exemple, la longueur de la
pièce doit être située dans une fourchette bien définie. Une technique couramment employée
consiste à prendre au hasard quelques pièces (un échantillon), à mesurer leur longueur et à
prendre une décision (de réglage par exemple) en fonction des ces mesures.
“ Donc la décision est prise à partir d’un échantillon”

Définition
Une population est un ensemble d’éléments de taille N qui possède un caractère statistique X
concernant les individus. Un échantillon est une partie de la population d’effectif n < N. Quand
un échantillon est représentatif d’une population, on peut, à partir de son analyse, tirer des
conclusions importantes pour la population. La statistique qui s’intéresse à ces conclusions est la “
statistique inductive ” car celle-ci n’est jamais absolument certaines.
La phase de la statistique qui se limite à décrire ou analyser une population donnée, sans tirer de
conclusion pour une population plus grande, est la “ statistique descriptive ” ou déductive.

Exemple
On prélève au hasard n ampoules électriques dans une production et on mesure leurs durées de
vie de fonctionnement. Le modèle statistique employé est alors le suivant:
Une certaine grandeur (la durée de vie de fonctionnement d’une ampoule électrique) est
considérée comme une v.a. définie sur un ensemble appelé population mère.
On fait correspondre à l’ampoule noi, le nombre xi qui est “ réalisation de la v.a. Xi.
• Xi est la v.a. qui représente “ la durée de vie de l’ampoule noi.
• On obtient ainsi n-uplet (x1, · · · , xn) réalisations de n-uplet de v.a. (X1, · · · , Xn).
Le n-uplet de v.a. (X1, · · · , Xn) est appelé « échantillon ».

2. L’échantillonnage
 En premier lieu, il faut définir l’unité de sondage : individus, entreprises, foyers, etc.
 En second lieu, on détermine la taille de l’échantillon.
 Enfin, on choisit parmi différentes techniques d’échantillonnage.
3. Types d’échantillonnage
Il existe plusieurs manières d’effectuer l’échantillonnage.
3-1. la méthode des quotas
L’échantillon devra avoir les mêmes caractéristiques que la population mère étudiée, selon
certains critères, échantillonnage stratifié, (ex : le sexe, l’âge, la catégorie socioprofessionnelle, le
lieu d'habitation, le niveau d’études…).

3-2. la méthode des itinéraires


Cette méthode consiste à imposer aux enquêteurs un itinéraire et des points d’enquête précis,
pour essayer de se rapprocher d’un sondage aléatoire : par exemple, sur un itinéraire précis,
l’enquêteur devra interroger une personne sur 5.

3-3. les échantillons arbitraires


Les personnes interrogées seront choisis de manière arbitraire et intuitive, lorsque la
représentativité n’est pas primordiale dans l’étude.

3-4. la technique par tirage aléatoire


Il s’agit de la méthode la plus rigoureuse et la plus scientifique : Les individus sont tirés au sort de
manière aléatoire au sein de la liste exhaustive de la population mère. Cette méthode est parfois
difficile à mettre en place en raison du nombre important d’individus de la population étudiée.
En fonction du nombre d'individus interrogés, on peut calculer la marge d'erreur. Plus la marge
d'erreur est faible, plus l'échantillon est représentatif.
Si l’échantillon est fait à l’aide d’un tirage aléatoire simple, on peut considérer que les v.a.
X1, · · ·, Xn suivent toutes la même loi et qu’elles sont indépendantes, on parle alors d’échantillon
i.i.d (indépendant et identiquement distribué).

4. Théorie de l’échantillonnage.
C’est l’étude des relations qui existent entre une population et les échantillons prélevés de cette
population.
• Les observations faites sur l’échantillon servent à répondre aux questions que l’on se pose
sur la population.
• Les caractéristiques observées sont des variables aléatoires.
• Leurs paramètres descriptifs permettent de connaître la distribution dans la population :
• Objectif : estimer les paramètres de la distribution de la population
• Moyen : utiliser les observations faites sur l’échantillon.

5. Constitution de l’Échantillon
• Un échantillon fourni des informations sur la population.
• Un bon échantillon « sans biais » doit être représentatif de la population dont il est issu.
• Nécessité de définir précisément la population.
• L’échantillonnage aléatoire (tirage au sort) en est le meilleur moyen.
• Le choix du processus peut dépendre de l’objectif de l’étude, donc du type d’étude.
6. Statistique d’un échantillon
Pour pouvoir tirer parti d’une réalisation d’échantillon, il est nécessaire de connaitre les
propriétés de l’échantillon en fonction des propriétés de la loi de probabilité de la v.a. X. La
plupart de ces propriétés porteront, non pas sur l’échantillon lui même, mais sur des fonctions de
cet échantillon, appelées statistiques, permettant de caractériser cet échantillon et qui seront donc
elles-mêmes des v.a. comme, par exemple, la moyenne des durées de vie de fonctionnement des
ampoules électriques.
Le but de l’échantillonnage est d’étudier les propriétés du n-uplet (X1, · · · , Xn) et ce qui se passe
lorsque la taille de l’échantillon est élevée.

Définition
Une statistique T est une v.a., fonction mesurable de (X1, · · · , Xn), c-à-d

T = f (X1, · · · Xn).
¯
6-1. Moyenne empirique X
¯
La principales statistiques d’échantillon est la statistique X dite moyenne empirique donnée par :
¯ 1
X =
n
∑n i=1Xi

Soit (X1, · · · , Xn) un échantillon tel que E(Xi) =m et var(Xi) =σ2 pour i= 1, · · · , n, alors
¯ ¯
• E(X)=m et var(X) = σ2 / n si l’échantillon est non exhaustif
¯ ¯
• E(X)=m et var(X) = σ2 .(N-n) / n.( N-1) si l’échantillon est exhaustif.
¯
Non exhaustif: Pour n suffisamment grand, X suit approximativement la loi normale N(m, σ2 /n).
Exhaustif : Pour n suffisamment grand, ¯X ~ N(m, σ2 (N-n) / n(N-1)).

6-2. Loi d’un pourcentage.


Considérons une population dont un pourcentage p d’éléments possède une certaine propriété.
Soit T la variable aléatoire, qui à tout échantillon aléatoire prélevé avec remise d’effectif n fixé,
associe le pourcentage d’éléments de cet échantillon possédant cette propriété.
Pour n suffisamment grand, T suit approximativement la loi normale N(p, p(1-p )/n) .
Exercices Echantillonnage

EX 1. La variable aléatoire X suit la loi normale N (12 ; 4). Calculer les probabilités
suivantes :
P ( X ≤ 15 ) ; P ( X ≥ 18 ) ; P ( X ≥ 7 ) ; P ( X ≤ 9 ) ; P(8 ≤ X ≤ 17 ).

EX 2. Dans un pays les statistiques font ressortir que 64% des ménages possèdent une voiture de
tourisme. Quelle est la probabilité que sur un échantillon au hasard de 225 ménages, la proportion
de ceux qui possèdent une voiture soit:
1) comprise entre 40% et 70%.
2) supérieure à 60%.
3) inférieure à 25%.

EX 3. Une machine produit des rondelles métalliques en grande série. Une rondelle est acceptée
si son diamètre extérieur est compris entre 21,9 et 22,1 mm. On suppose que sur l'ensemble de la
production le diamètre extérieur des rondelles est une variable aléatoire X qui suit la loi normale
de moyenne 22 mm et d'écart type 0,05 mm. Quelle est la probabilité qu'une pièce soit refusée ?

EX 4. Supposons que le revenu moyen des ménages d’une population est de 42 000 $ et que l’écart-
type de la population est de 12 000 $. On tire un échantillon aléatoire simple de 35 ménages.
a) Quelle est la probabilité que le revenu moyen des ménages de l’échantillon soit supérieur à
43 000$?
b) Quelle est la probabilité de surestimer la moyenne de la population de plus de 2 000 $?
Estimation
Intervalle de Confiance

1. Introduction
C’est le problème inverse de l’échantillonnage; c’est à dire connaissant des valeurs de certaines
grandeurs grâce à des observations réalisées sur un échantillon, on cherche à en déduire des
informations sur la population totale.

Exemple 1.
Un homme politique désire connaitre sa popularité, en la mesurant par la proportion de personnes
qui lui sont favorables. Pour ceci, il fait effectuer un sondage (supposé ici tiré de manière aléatoire
simple) et obtient 35% d’avis favorable. Comment conclure?
Une solution intuitive est de retenir la proportion obtenue dans le sondage, c’est-à-dire 35%; mais
comment justifier un tel choix? Quelle confiance peut-on donner à ce résultat?
Pour ceci, il est possible de modéliser cette enquête en considérant que le sondage correspond à
un échantillon X1,X2, · · · ,Xn o`u chaque Xi est une variable aléatoire de Bernoulli, prenant la valeur
1 dans le cas favorable et 0 sinon, et ayant pour paramètre p la proportion des personnes
favorables.
Le problème est maintenant d’évaluer p à partir d’une réalisation de l’échantillon. La proportion
des personnes de l’échantillon
¯ qui sont favorables à l’homme politique, ici 35%, correspond alors à
la moyenne empirique X de l’échantillon. A partir de cette modélisation, il est alors possible
d’étudier les probabilités de l’estimateur proposé, par exemple dans notre cas, la loi des grands
nombres permet d’affirmer que lorsque la taille de l’échantillon devient grande, la proportion
d’avis favorable dans l’échantillon tend vers la valeur recherchée p.

Exemple 2.
On dispose des 10 valeurs (4,8 ; 6,0 ; 0,07 ; 3,4 ; 0,6 ; 3,8 ; 6,2 ; 5,3 ; 8,4 ; 7,6), réalisations d’un
échantillon X1,X2, · · ·X10 issu d’une loi uniforme sur [0, a] o`u a est un paramètre inconnu. On
cherche à déterminer ce paramètre a. Les solutions que l’on peut imaginer peuvent être variées:
 La valeur maximum (ici 8,4)
 2 fois la valeur moyenne (ici 2.4,6 =9,2)
 autre?
Dans ces deux exemples, un certain nombre de problèmes apparaissent, en particulier:
 Comment estimer un paramètre?
 Comment choisir entre plusieurs solutions?
L’objectif de l’estimation statistique consiste à donner des valeurs approchées aux paramètres
(m, σ2) d’une population à partir de l’échantillon de taille n issu de cette population.

L’objet de l’estimation statistique est de déterminer une valeur approchée d’un paramètre inconnu
θ, à partir des valeurs (x1, · · · , xn) observées pour (X1, · · ·Xn).
Deux approches sont possibles:
 ou bien on désire connaitre une valeur unique ayant une forte probabilité d’être voisine
d’un paramètre inconnu θ; on est alors dans le cas de l’estimation ponctuelle.
 ou bien on désire construire un intervalle qui a une forte probabilité de contenir le
paramètre θ. Cette approche est l’estimation par intervalle de confiance.
Ces deux approches sont liées, la seconde s’appuyant souvent sur la première.
2. L’estimateur
2-1. La notion de l’estimateur
On considère une v.a. X dont la loi dépend d’un paramètre θ qui est inconnu, et on suppose disposer
d’une réalisation x1, · · · , xn d’un échantillon i.i.d Xn, · · · ,Xn de loi parente X. Le problème est
d’estimer le paramètre inconnu à partir de la réalisation x1, · · · , xn.

Définition
Un estimateur d’un paramètre θ est une fonction statistique T de X1, · · · ,Xn,
T = g(X1, · · · ,Xn)
Si T un estimateur alors t = g(x1, · · · , xn) réalisation de cet estimateur, est appelée « estimation ».

2-2. Qualité d’un Estimateur


 T : estimateur sans biais de θ si E(T) = θ.
 T : estimateur biaisé de θ si E(T) ≠ θ et le biais = E(T) – θ.

3. Estimation ponctuelle
3-1. Moyenne
De manière générale, on choisit la moyenne empirique¯X =1/n∑n i=1Xi d’un échantillon prélevé au
hasard dans une population comme meilleur estimateur ponctuelle de la moyenne inconnue μ de
cette population. C’est un estimateur sans biais car E(¯X) = μ.

2. Proportion
De même, on choisit la proportion fe des éléments possédant une certaine propriété dans un
échantillon prélevé aléatoirement dans une population comme meilleure estimation ponctuelle de
la proportion inconnue p des éléments de cette population ayant cette propriété.
F l’estimateur associé à fe est un estimateur sans biais car E(F) = p.

3. Variance. Ecart - type


On associe S2 =1/n∑n i=1 (Xi −¯X)2, variance empirique de l’échantillon. On a donc
E(S2) =σ 2(n − 1)/n ≠ σ 2.
S2 est un estimateur biaisé. Si n tend vers l’infini, alors E(S2) →σ2, donc S2 est asymptotiquement
sans biais. Si au lieu de S2, on prend la variance empirique corrigée S’2 tel que
S’2 = S2.n/(n − 1)
alors E(S’2) = σ2 et donc S’2 est un estimateur sans biais.

4. Estimation par intervalle de confiance


L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante, on préfère
souvent donner un intervalle de valeurs. On cherche des intervalles dite « intervalle de confiance »
qui, généralement, à 95% ou 99%des cas, contiennent la moyenne μ inconnue ou le pourcentage p
d’une certaine propriété que possède la population.
L’estimation par intervalle de confiance vise à établir tout intervalle construit de la manière suivante:
A partir d’un échantillon (X1, · · · ,Xn) de la v.a. et s’étant donné un nombre α, compris entre 0
et 1 ( en général 0 < α < 0.9), on se propose de déterminer deux statistiques T1 = f(X1, · · · ,Xn) et
T2 = g(X1, · · · ,Xn) vérifiant
T1 ≤ T2 et P ( θ∉ [T1, T2] ) = α
ou ce qui revient
T1 ≤ T2 et P ( T1 ≤ θ ≤ T2 ) = 1 - α
Par définition, l’intervalle [T1, T2] dont les bornes sont aléatoires est appelé “ intervalle de confiance
au seuil de risque α pour le paramètre θ.”
Si l’on observe pour X1 la valeur x1, pour X2 la valeur x2, etc..., on a
T1 = f(X1, · · · ,Xn) = f(x1, · · · , xn) = t1
T2 = g(X1, · · · ,Xn) = g(x1, · · · , xn) = t2
et la réalisation de l’intervalle de confiance est l’intervalle [t1, t2], avec t1 ≤ t2.

Remarque
Il n’y a pas unicité de l’intervalle de confiance. Le choix peut se faire en cherchant l’intervalle de
plus petite longueur.

4-1. Fonction de répartition et fractille.


La détermination des bornes peut se faire facilement dès lorsque l’on connait la fonction de
répartition de la loi de probabilité de l’estimateur.
Soit X une v.a. de fonction de répartition F. On définit tα par P (X ≤ tα ) = α, c’est-à-dire F( tα ) = α.
La valeur F−1(α) est appelée fractile d’ordre α. Remarquons que l’on a aussi P ( X > t1-α ) = α.

4-2. Détermination pratique de tα.


 A l’aide d’une machine. Il est nécessaire dans ces cas de disposer de la fonction donnant les
fractiles de la loi, c’est-à-dire de la fonction F−1.
 A l’aide d’une table. La table fournit la répartition, par exemple pour la loi normale, nous
disposons pour toute valeur x allant de 0.01 à 400 des valeurs F(x) et F(−x). Pour les valeurs
x ≤−4, on a F(x) = 0 et pour les valeurs x ≥ 4, on a F(x) = 1. Il faut alors chercher dans la
table, la valeur α et en déduire la valeur x correspondante. Par exemple, si on cherche à
calculer t0.95, la valeur de la table la plus proche étant 0.9505, on en déduit t0.95= 1.65, par
contre, pour t0.05, la valeur la plus proche est 0.0495, on en déduit cette fois t0.05= −1.65
 La table fournit directement les fractiles, c’est le cas par exemple pour les lois du chi-deux χ2
et de Student. Dans ce cas, il suffit de lire directement cette table.

4-3. Intervalle de confiance classique.


a) Estimation de la moyenne d’une v.a. normale X ~ N(m, σ2).
• σ2 est connue
X est un très bon estimateur de la moyenne et il suit approximativement la loi normale N(m, σ2 /n).
Alors l’intervalle de confiance de la moyenne m de la population, avec le coefficient de confiance
2F(t) - 1, lu dans la table de la loi normale centrée réduite N(0 ; 1) est : [xe – t.σ/√n ; xe + t.σ/√n ].
t est tel que F(t) = 1 − α /2.
Les cas usuels les plus fréquent sont :
 coefficient de confiance 95% alors t = 1,96.
 coefficient de confiance 99% alors t=2,58.

• σ2 est inconnue et n < 30


On a X suit approximativement la loi de Student à n – 1 degrés de liberté. Alors l’intervalle de
confiance de la moyenne m de la population, avec le coefficient de confiance 2FS(t) - 1, lu dans la
table de Student à n – 1 degrés de liberté est : [xe – t.σe/√n-1 ; xe + t.σe/√n-1 ]

• σ2 est inconnue et n ≥ 30
On a X suit approximativement la loi normale N(m, σ2 /n). Alors l’intervalle de confiance de la
moyenne m de la population, avec le coefficient de confiance 2FN(t) - 1, lu dans la table de la loi
normale est : [xe – t.σe/√n-1 ; xe + t.σe/√n-1 ] .

b) Estimation de la variance d’une loi normale.


• La moyenne m est connue
La statistique T =1/n∑n i=1 (Xi − m)2 est un très bon estimateur de σ2 . Alors l’intervalle de confiance
de la variance σ2 de la population, avec le coefficient de confiance Fχ2 (k2) - Fχ2 (k1), lu dans la table
de χn2 à n degrés de liberté est : ]nt /k2 ; nt /k1 [ avec t=1/n∑n i=1 (xi − m)2
k1 est tel que Fχn2 (k1) = α /2, k2 est tel que Fχn2 (k2) = 1 − α /2.

• La moyenne m est inconnue


S =1/n∑ i=1 (Xi −X)2 est un estimateur de σ2 . Alors l’intervalle de confiance de la variance σ2 de la
2 n

population, avec le coefficient de confiance Fχ2 (k2) - Fχ2 (k1), lu dans la table de χn-12 à n-1 degrés de
liberté est : ]nse2 /k2 ; nse2 /k1 [ avec se2 =1/n∑n i=1 (xi − xe)2
k1 est tel que Fχn-12 (k1) = α /2, k2 est tel que Fχn-12 (k2) = 1 − α /2.

c) Intervalle de confiance pour une proportion.


• p est inconnue, fe est connue et n < 30
On a F suit approximativement la loi de Student à n – 1 degrés de liberté. Alors l’intervalle de
confiance de la proportion p de la population, avec le coefficient de confiance 2 FS (t) - 1, lu dans la
table de Student à n – 1 degrés de liberté est : [fe – t√ fe (1- fe )/n-1 ; fe + t√ fe (1- fe )/n-1]

• p est inconnue, fe est connue et n ≥ 30


On a F suit approximativement la loi normale N(p, p(1-p) /n). Alors l’intervalle de confiance de la
proportion p de la population, avec le coefficient de confiance 2FN (t) - 1, lu dans la table de la loi
normale est : [fe – t√ fe (1- fe )/n-1 ; fe + t√ fe (1- fe )/n-1] .

Exercices.
EX. 1 Lors d’un concours radiophonique, on note X le nombre de réponses reçues chaque jour.
On suppose que X suit une loi normale de paramètres m et σ. Durant les 10 premiers jours, on a
obtenu : x1 = 200 ; x2 = 240 ; x3 = 190 ; x4 = 150 ; x5 = 220 ; x6 = 180 ; x7 = 170 ; x8 = 230 ;
x9 = 210 et x10 = 210.
1) Déterminer une estimation ponctuelle de m et σ.

EX.2 Dans une population d’étudiants en sociologie, on a prélevé, indépendamment, deux


échantillons de taille n1 = 120 et n2 = 150. On constate que 48 étudiants de l’échantillon 1 et 66
étudiants de l’échantillon 2 ont une formation secondaire scientifique; Soit p la proportion
d’étudiants de la population ayant une formation scientifique ; calculer les estimations
ponctuelles possibles de p.

EX.3 Dans une population P de grand effectif, on prélève de manière non exhaustive, un échantillon
de 100 personnes dont on note la masse en kg:
Masse : 62 ; 64 ; 68 ; 10 ; 74
Effectif 5 ; 18 ; 42 ; 27 ; 8
1) Calculer la moyenne et l’écart-type de cet échantillon.
2) Donner un intervalle de confiance de la moyenne m des masses des personnes de P au coefficient
de confiance 95%.

EX.4 Lors d’un contrôle de qualité sur une population d’appareils ménagers, au cours d’un mois de
fabrication, on prélève de manière non exhaustive un échantillon de 1000 appareils. Après un test
de conformité, on constate que 60 appareils ont un défaut.
1) Donner un intervalle de confiance du pourcentage p d’appareils défectueux au risque de 5%.

EX.5 Une centrale laitière du Souss envisage de s’implanter sur le marché du nord du Maroc, pour
vendre son lait. Les services financiers ont calculé que cette implantation est rentable si la
consommation moyenne par habitant et par an est supérieure à 20 litres. Une enquête de 400
personnes montre que, sur cet échantillon, la consommation moyenne est de 23 litres.
En utilisant des études précédemment effectuées, il est possible de modéliser cette enquête, en
considérant que la consommation individuelle par an d’une personne est une v.a. dont la
distribution est une loi normale de moyenne m inconnue et d’écart type σ = 10.
L’enquête fournit donc une réalisation (x1, · · · , xn) de l’échantillon i.i.d. (X1, · · · ,Xn) dont la loi
parente X a une distribution N(m, σ 2).
1) Quel est l’intervalle de confiance pour la moyenne m à un niveau de confiance de 99% ?
2) Quelle décision l’entreprise doit-elle prendre?

EX.6 Soient (X1, · · · ,Xn) un échantillon d’une population P1(X) et (Y1, · · · , Yk) un échantillon d’une
population P2(Y ). Supposons que les n + k v.a. sont indépendantes. X suit la loi normale N(m1, σ21)
et Y suit la loi normale N(m2, σ22).
1) Donner un estimateur de la différence des deux variables aléatoires X et Y.
2) Donner un Intervalle de confiance pour m1 - m2 au niveau 1 − α.

EX.7 Une machine fabrique des rondelles en série. Leur diamètre d est une variable gaussienne dont
l’écart-type est égale à 1 millimètre. On prélève au hasard un échantillon de neuf rondelles. Les
mesures des diamètres, en millimètres, sont les suivantes:
20.1 ; 19.9 ; 20.0 ; 19.8 ; 19.7 ; 20.2 ; 20.1 ; 23.1 ; 22.8
1) Construire un intervalle qui contienne avec une probabilité de 0.95 la moyenne m de d.
2) Même question en supposant que l’écart-type d a une valeur inconnue.
3) En utilisant les données numérique de 1), l’écart-type de d étant supposé inconnu, construire
un intervalle qui contienne avec une probabilité de 0.9 la variance de d.

EX.8 Les salaires mensuels des employés d’une entreprise sont supposés suivre une loi normale de
paramètres μ et σ.
1) Pour un échantillon de taille n = 10, on obtient une moyenne m = 6500DH et un écart-type
s = 900DH. Donner un intervalle de confiance au niveau 0.95 pour μ.
2) Pour un échantillon de taille n = 100, on obtient une moyenne m = 6200DH et un écart-type
s = 850DH. Donner un intervalle de confiance au niveau 0.95 pour μ.

Exercices tests
EX.1 un bureau d’études a prévu que la durée moyenne d’exécution d’une tâche doit être de 6.4mn.
On peut tester cette hypothèse, au seuil α = 0.01, mais on veut aussi limiter à 5% la probabilité
d’accepter l’hypothèse m0 = 6.4, alors qu’en réalité la moyenne vraie excèderait de 0.5mn, ou
plus, le temps prévu par le bureau d’études.
Le teste consiste à chronométrer les durées effectives lorsque l’on répète la tâche plusieurs fois.
La lecture sur les tables pour α = 0.01 et β = 0.05 ( en faisant un écart-type estimé), montre
qu’il faut prendre un échantillon de taille n = 15.
Les quinze chronométrages ont donné les temps suivants:
6.10, 6.65, 7.00, 6.25, 6.35, 6.85, 7.10,
7.35, 7.05, 6.90, 6.70, 7.20, 7.15, 6.95
1) Quelle conclusion découle de l’exécution du test ?
H0 : m = 6.4 contre l’hypothèse H1 : m ≠ 6.4 (α étant fixé à 1%).
On admet que la durée d’exécution de la tâche est une variable aléatoire normale.

EX.2 Une machine fabrique des pièces dont la langueur suit une loi normale de paramètres μ et σ.
Pour tester l’hypothèse nulle H0 : μ = 100 cm contre H1 : μ ≠ 100 cm au risque 5%.
On prélève
a) Un échantillon de taille 10 et on obtient m = 99 cm et s = 2 cm. Doit-on rejeter H0?
b) Un échantillon de taille 50 et on obtient m = 99 cm et s = 2 cm. Doit-on rejeter H0?
c) Que peut-on conclure?

EX.3 Dans une entreprise, deux machines conditionnent le même produit, Pour la première, le poids
du produit après conditionnement suit une loi normale de paramètres μ1 et σ1. Pour la seconde
le poids du produit après conditionnement suit une loi normale de paramètres μ2 et σ2.Sachant que
σ1 = 5 g et σ2 = 7 g , on prélève un échantillon de taille n = 10 de produits conditionnés par la
deuxième machine. On obtient les moyennes suivantes: m1 = 1003 g et m2 = 995 g.
Tester l’hypothèse ” H0 : μ1 = μ2 ” contre ” H1 : μ1 ≠ μ2 ” au risque 0.02.

EX.4 On veut comparer les moyennes d’âge du personnel de deux entreprises. On prélève au hasard
un échantillon de 10% d’individus dans chaque entreprise. On obtient les moyennes d’âges et
les écarts-types suivants:Entreprise I : n1 = 41 ; m1 = 39 ans ; s1 = 6 ans.
Entreprise II : n1 = 62 ; m1 = 41 ans ; s1 = 8 ans.
Soit μ1 et μ2 les moyennes d’âges du personnel des entreprises I et II. On suppose que l’âge
suit une loi normale dans chacune des deux populations.
Tester l’hypothèse ” H0 : μ1 = μ2 ” contre ” H1 : μ1 ≠ μ2 ” au risque 0.05.