Vous êtes sur la page 1sur 4

Correction CC du 6 janvier 2022 (durée 2h)

Tests Statistiques (Prof Gilles Durrieu)


Calculatrices autorisées et documents autorisés UBS

Exercice 1 (8 points) Les auteurs d’une étude sur la gestion des ressources humaines dans les entreprises
françaises ont constitué un échantillon de 136 entreprises. Pour chaque entreprise, ils ont relevé la présence
ou l’absence d’un Directeur des Ressources Humaines (DRH) et la taille de l’entreprise. La répartition
des 136 entreprises selon les modalités de ces 2 variables est la suivante :

< 50 50 à 99 100 à 249 > 249


avec DRH 16 16 18 16
sans DRH 20 21 28 1

1. Définir les variables et leur type.


2. Tester au seuil α = 5% l’existence d’un lien/d’une dépendance entre les deux variables ?

Correction :
1. Les deux variables sont qualitatives (une nominale et l’autre ordinale) et sont respectivement DRH
et taille de l’entreprise. Cette dernière est discrétisée en 4 classes.
2. On a : n1. = 66, n2. = 70, n.1 = 36, n.2 = 37, n.3 = 46, n.4 = 17 et n.. = 136. On en début le
tableau des effectifs pour i = 1, 2 et j = 1, 2, 3, 4
ni. × n.j
eij =
n..
sous l’hypothèse d’indépendance des 2 variables aléatoires. Les calculs donnent e11 = 17.47059, e12 =
17.95588, e13 = 22.32353, e14 = 8.25, e21 = 18.52941, e22 = 19.04412, e23 = 23.67647, e24 = 8.75.
La statistique de test
2 X 4 2
X (nij − eij )
χ2 =
i=1 j=1
eij

suit sous l’hypothèse nulle d’indépendance des 2 variables aléatoires une loi du χ2 à (2−1)×(4−1)
degrés de liberté.
On obtient χ2calc = 16.42589 et χ21−α,3 = 7.83 pour α = 5%. Par conséquent au seuil α = 5%, nous
concluons à l’existence d’une dépendance entre les 2 variables.

Exercice 3 (6 points)
Dans un dossier sur les sondages (politiques) paru dans Le Monde daté du 9 mars 2011, le journaliste
Thomas Wieder écrit : “Dépendant de la taille de l’échantillon, les marges d’erreur varient en fonction des
pourcentages obtenus. Ainsi, si l’échantillon interrogé est constitué de 1000 personnes, la marge d’erreur
d’un candidat crédité de 10% des voix est de deux points en plus ou en moins. Elle sera de trois points
pour les candidats crédités de 50% des voix.”

Pouvez-vous (avec modèle statistique détaillé et calculs détaillés à l’appui) confirmer ou infirmer les
dires du journaliste pour un risque d’erreur α = 5% ?

Correction : Ce sondage politique est modélisé par une variable aléatoire X prenant la valeur 1 si l’individu
vote pour le candidat et 0 sinon. La variable aléatoire X suit donc une loi de Bernoulli de paramètre
p où p est la proportion d’individus votant pour le candidat (dans la population). Si X1 , . . . , Xn est un

1
échantillon de taille n de X alors la fréquence empirique F est un estimateur sans biais et convergent de
p. Pour n grand (n ≥ 30) on a d’après le théorème centrale limite :
n
1X
X̄ = Xi
n i=1

qui peut être approchée par une loi normale d’espérance mathématique p et de variance p(1 − p)/n.
D’après le cours, on sait qu’un intervalle de confiance de p de niveau de confiance (1 − α)% est donné
par : " r r #
X̄ × (1 − X̄) X̄ × (1 − X̄)
IC = X̄ − z1−α/2 ; X̄ + z1−α/2 .
n n
où z1−α/2 est la valeur critique à lire sur la table de la loi N (0, 1) avec α représentant le risque d’erreur
de première espèce fixé a priori. Cet intervalle de confiance est donc pour α = 5%
" r r #
X̄ × (1 − X̄) X̄ × (1 − X̄)
IC = X̄ − 1.96 ; X̄ + 1.96 .
n n

La marge d’erreur notée me (observée) discutée par le journaliste est donc :


r
X̄ × (1 − X̄)
me = 1.96 .
n
Lorsque n = 1000 et X̄ = 10%,
r
0.1 × (1 − 0.1)
me = 1.96 = 0.0186 ≈ 2%.
1000
De même lorsque n = 1000 et X̄ = 50%, on a :
r
0.5 × (1 − 0.5)
me = 1.96 = 0.031 ≈ 3%.
1000
Ces deux calculs confirment donc les affirmations du journaliste.

Exercice 2 (6 points) L’Organisation Mondiale de la Santé (OMS) recommande de consommer moins


de 5 grammes de sel par jour pour un adulte, et d’ajuster à la baisse pour les enfants de 2 à 15 ans. Une
commune française a mis en place une démarche de réduction du sel dans les repas servis aux enfants dans
ses cantines. Ramenée au repas du midi, la recommandation de l’OMS se traduit par un maximum de 2.6
grammes de sel par repas servi. Après une période de formation de ses cuisiniers, la commune souhaite
vérifier que les recommandations de l’OMS sont bien atteintes. Pour cela, elle prévoit de mesurer la
quantité moyenne de sel dans les repas servis aux enfants.
Dans la suite, on suppose que la quantité de sel contenu dans un repas suit une loi normale.

Partie 1
Afin d’estimer la quantité moyenne de sel contenu dans un repas, il est prévu de mesurer la quantité
de sel dans n repas prélevés au hasard.
1. Donner le modèle statistique (population, variable, échantillon) correspondant.
La population Ω correspond aux repas servis dans les cantines de la ville. La variable X mesure la
quantité de sel dans un repas. Il est supposé que X suit une loi normale N (µ, σ 2 ) où µ représente la
quantité moyenne de sel dans l’ensemble des repas et σ 2 la variance. Les n mesures correspondent
à un échantillon de X, X1 , . . . , Xn .

2
2. Donner un estimateur de la quantité moyenne de sel en précisant ses propriétés.
Un estimateur de la quantité moyenne de sel est
n
1X
X̄ = Xi .
n i=1

C’est un estimateur sans biais (E(X̄) = µ) et convergent de µ (X̄ → µ car Var(X̄) → 0).
3. Donner un intervalle de confiance de la quantité moyenne à 95% en supposant les variations
connues.
D’après le théorème de la limite centrale, l’estimateur X̄ converge en loi vers une loi normale
N (µ, σ 2 /n). On en déduit :
   
X̄ − µ σ σ
P −z1−α/2 ≤ √ ≤ Z1−α/2 = P X̄ − z1−α/2 √ ≤ µ ≤ X̄ + z1−α/2 √ = 1 − α.
σ/ n n n
où z1−α/2 est la valeur critique/valeur théorique à lire sur la table de la loi N (0, 1). Pour α = 5%,
l’intervalle de confiance de µ de coefficient de confiance (1 − α)% est :
 
σ σ
ICµ = X̄ − 1.96 √ , X̄ + 1.96 √ .
n n

4. Quelle doit être la taille de l’échantillon pour pouvoir estimer à 95% la quantité moyenne à 0.5
gramme près. (Pour cela, on pourra supposer que l’écart-type de la quantité de sel entre les repas
est égale à 1.5 gramme.)
Pour pouvoir estimer à 95% la quantité moyenne à 0.5 gramme près, il faut que la précision de
l’IC précédent soit inférieure à 0.5. D’où
σ
1.96 × √ < 0.5,
n
et donc  2
1.96 σ
n≥ = 34.47.
0.5

Partie 2
La quantité de sel est mesurée dans 36 repas préparés dans les restaurants scolaires de la commune.
Les résultats de ces mesures dont disponibles dans la sortie ci-dessous.

N Minimum Maximum Moyenne Ecart-type


Sel 36 1.100 5.900 2.850 1.097

1. Commenter ce tableau. Facile.


2. Donner un intervalle de confiance à 99% de la quantité de sel (la variance σ 2 est ici inconnue).
Puisque la variance est inconnue, l’intervalle de confiance de µ est :
 
S S
ICµ = X̄ − t1−α/2,n−1 √ , X̄ + t1−α/2,n−1 √ = [2.35, 3.35].
n n

Partie 3
On souhaite à présent vérifier que la recommandation de l’OMS (2.6 grammes de sel par repas) n’est
pas dépassée en moyenne.

3
1. Préciser, en les justifiant, les hypothèses du test.
L’hypothèse de référence est le non dépassement de la norme OMS, soit H0 : µ = µ0 = 2.6 que
l’on teste contre l’hypothèse alternative HA : µ 6= µ0 = 2.6.
2. Construire un test statistique à 5% et donner une conclusion.
La statistique de test s’écrit :
X̄ − µ0
t= √ ,
S/ n
qui suit sous H0 une loi de Student à (n − 1) degré de liberté.
On obtient tcalc = 1.3678 et t1−α,n−1 = 1.69. Par conséquent, la norme n’est pas dépassée.

Vous aimerez peut-être aussi