Académique Documents
Professionnel Documents
Culture Documents
Exercice 1 (8 points) Les auteurs d’une étude sur la gestion des ressources humaines dans les entreprises
françaises ont constitué un échantillon de 136 entreprises. Pour chaque entreprise, ils ont relevé la présence
ou l’absence d’un Directeur des Ressources Humaines (DRH) et la taille de l’entreprise. La répartition
des 136 entreprises selon les modalités de ces 2 variables est la suivante :
Correction :
1. Les deux variables sont qualitatives (une nominale et l’autre ordinale) et sont respectivement DRH
et taille de l’entreprise. Cette dernière est discrétisée en 4 classes.
2. On a : n1. = 66, n2. = 70, n.1 = 36, n.2 = 37, n.3 = 46, n.4 = 17 et n.. = 136. On en début le
tableau des effectifs pour i = 1, 2 et j = 1, 2, 3, 4
ni. × n.j
eij =
n..
sous l’hypothèse d’indépendance des 2 variables aléatoires. Les calculs donnent e11 = 17.47059, e12 =
17.95588, e13 = 22.32353, e14 = 8.25, e21 = 18.52941, e22 = 19.04412, e23 = 23.67647, e24 = 8.75.
La statistique de test
2 X 4 2
X (nij − eij )
χ2 =
i=1 j=1
eij
suit sous l’hypothèse nulle d’indépendance des 2 variables aléatoires une loi du χ2 à (2−1)×(4−1)
degrés de liberté.
On obtient χ2calc = 16.42589 et χ21−α,3 = 7.83 pour α = 5%. Par conséquent au seuil α = 5%, nous
concluons à l’existence d’une dépendance entre les 2 variables.
Exercice 3 (6 points)
Dans un dossier sur les sondages (politiques) paru dans Le Monde daté du 9 mars 2011, le journaliste
Thomas Wieder écrit : “Dépendant de la taille de l’échantillon, les marges d’erreur varient en fonction des
pourcentages obtenus. Ainsi, si l’échantillon interrogé est constitué de 1000 personnes, la marge d’erreur
d’un candidat crédité de 10% des voix est de deux points en plus ou en moins. Elle sera de trois points
pour les candidats crédités de 50% des voix.”
Pouvez-vous (avec modèle statistique détaillé et calculs détaillés à l’appui) confirmer ou infirmer les
dires du journaliste pour un risque d’erreur α = 5% ?
Correction : Ce sondage politique est modélisé par une variable aléatoire X prenant la valeur 1 si l’individu
vote pour le candidat et 0 sinon. La variable aléatoire X suit donc une loi de Bernoulli de paramètre
p où p est la proportion d’individus votant pour le candidat (dans la population). Si X1 , . . . , Xn est un
1
échantillon de taille n de X alors la fréquence empirique F est un estimateur sans biais et convergent de
p. Pour n grand (n ≥ 30) on a d’après le théorème centrale limite :
n
1X
X̄ = Xi
n i=1
qui peut être approchée par une loi normale d’espérance mathématique p et de variance p(1 − p)/n.
D’après le cours, on sait qu’un intervalle de confiance de p de niveau de confiance (1 − α)% est donné
par : " r r #
X̄ × (1 − X̄) X̄ × (1 − X̄)
IC = X̄ − z1−α/2 ; X̄ + z1−α/2 .
n n
où z1−α/2 est la valeur critique à lire sur la table de la loi N (0, 1) avec α représentant le risque d’erreur
de première espèce fixé a priori. Cet intervalle de confiance est donc pour α = 5%
" r r #
X̄ × (1 − X̄) X̄ × (1 − X̄)
IC = X̄ − 1.96 ; X̄ + 1.96 .
n n
Partie 1
Afin d’estimer la quantité moyenne de sel contenu dans un repas, il est prévu de mesurer la quantité
de sel dans n repas prélevés au hasard.
1. Donner le modèle statistique (population, variable, échantillon) correspondant.
La population Ω correspond aux repas servis dans les cantines de la ville. La variable X mesure la
quantité de sel dans un repas. Il est supposé que X suit une loi normale N (µ, σ 2 ) où µ représente la
quantité moyenne de sel dans l’ensemble des repas et σ 2 la variance. Les n mesures correspondent
à un échantillon de X, X1 , . . . , Xn .
2
2. Donner un estimateur de la quantité moyenne de sel en précisant ses propriétés.
Un estimateur de la quantité moyenne de sel est
n
1X
X̄ = Xi .
n i=1
C’est un estimateur sans biais (E(X̄) = µ) et convergent de µ (X̄ → µ car Var(X̄) → 0).
3. Donner un intervalle de confiance de la quantité moyenne à 95% en supposant les variations
connues.
D’après le théorème de la limite centrale, l’estimateur X̄ converge en loi vers une loi normale
N (µ, σ 2 /n). On en déduit :
X̄ − µ σ σ
P −z1−α/2 ≤ √ ≤ Z1−α/2 = P X̄ − z1−α/2 √ ≤ µ ≤ X̄ + z1−α/2 √ = 1 − α.
σ/ n n n
où z1−α/2 est la valeur critique/valeur théorique à lire sur la table de la loi N (0, 1). Pour α = 5%,
l’intervalle de confiance de µ de coefficient de confiance (1 − α)% est :
σ σ
ICµ = X̄ − 1.96 √ , X̄ + 1.96 √ .
n n
4. Quelle doit être la taille de l’échantillon pour pouvoir estimer à 95% la quantité moyenne à 0.5
gramme près. (Pour cela, on pourra supposer que l’écart-type de la quantité de sel entre les repas
est égale à 1.5 gramme.)
Pour pouvoir estimer à 95% la quantité moyenne à 0.5 gramme près, il faut que la précision de
l’IC précédent soit inférieure à 0.5. D’où
σ
1.96 × √ < 0.5,
n
et donc 2
1.96 σ
n≥ = 34.47.
0.5
Partie 2
La quantité de sel est mesurée dans 36 repas préparés dans les restaurants scolaires de la commune.
Les résultats de ces mesures dont disponibles dans la sortie ci-dessous.
Partie 3
On souhaite à présent vérifier que la recommandation de l’OMS (2.6 grammes de sel par repas) n’est
pas dépassée en moyenne.
3
1. Préciser, en les justifiant, les hypothèses du test.
L’hypothèse de référence est le non dépassement de la norme OMS, soit H0 : µ = µ0 = 2.6 que
l’on teste contre l’hypothèse alternative HA : µ 6= µ0 = 2.6.
2. Construire un test statistique à 5% et donner une conclusion.
La statistique de test s’écrit :
X̄ − µ0
t= √ ,
S/ n
qui suit sous H0 une loi de Student à (n − 1) degré de liberté.
On obtient tcalc = 1.3678 et t1−α,n−1 = 1.69. Par conséquent, la norme n’est pas dépassée.