Vous êtes sur la page 1sur 6

☐ 1A ☒ 2A ☐ 3A ☐ 4A ☐ 5A

☐ Groupe AGRO ☒ Spécialité Agronomie et Agro-Industries ☒ FISE


☐ Groupe FOOD ☐ Spécialité Alimentation et Santé
☐ FISA
☐ Groupe EARTH ☐ Spécialité Géosciences et Environnement
A remplir par l’enseignant

CONTRÔLE ☐ TSP Géologie ☐ TSP Géologie ☐ Avec documents


Numéro promotion : 019 Année : 2019/ 2020 ☒ Sans document
RMO ☐ Avec calculatrice personnelle
Durée : 2h00
(ou RUE) : CN. NIAMBA ☒ Avec calculatrice de l’intendance
Intervenants : CN. NIAMBA, A. N’GUESSAN Date : 13/01/2020 ☐ Sans calculatrice
Infos Page 1 sur 6
complémentaires :
Module Note
(ou UE) :
STATISTIQUE INFERENTIELLE
obtenue :
Formulaire & Tables

A remplir par l’étudiant :

NOM étudiant : ……………………..……………………………………………….Prénom :………………..…………………………..…

Promotion (ou groupe si 1A) : …………………………………………………Numéro de place :…………….

***************************************************************************************

Ce contrôle comporte 3 exercices indépendants.

Un formulaire et une table de lois sont fournis en annexes.

Une attention particulière est à apporter à la rédaction. Vous êtes priés de répondre sur le questionnaire,
aux emplacements prévus à cet effet.

Bon travail !
Module : STATISTIQUE INFERENTIELLE Page 2 sur 6

Nom de l’étudiant : ................................................ Prénom : .......................................... Place : ................

EXERCICE 1 (3 POINTS)

1. Soit (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) un échantillon aléatoire simple de taille 𝑛 tel que 𝐸(𝑋𝑖 ) = 𝜇 et 𝑉(𝑋𝑖 ) = 𝜎 2 .
1
Nous savons que les estimateurs concurrents de 𝜎 2 sont 𝑆1 2 = 𝑛−1 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 et 𝑆2 2 =
1 𝑛 1
∑𝑖=1(𝑋𝑖 − 𝑋̅)2 avec 𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 .
𝑛 𝑛
Lequel des deux estimateurs est un estimateur biaisé de 𝜎 2 ? Celui-ci sur-estime-t-il 𝜎 2 ou sous-
estime-t-il 𝜎 2 ? Justifier vos réponses.

2 𝑛−1
NOTE : 𝐸 (𝑆1 ) = 𝜎2 et 𝐸(𝑆2 2 ) = ( ) 𝜎2
𝑛

𝑛−1 𝜎2
𝐸(𝑆1 2 ) − 𝜎 2 = 0 alors que 𝐸(𝑆2 2 ) − 𝜎 2 = ( ) 𝜎2 − 𝜎2 = − ≠ 0.
𝑛 𝑛
L’estimateur biaisé de 𝜎 2 est 𝑆2 2 . Celui-ci sous-estime 𝜎 2 .

2. Soit (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) un échantillon aléatoire simple de taille 𝑛 tel que 𝑋𝑖 suit la loi de Bernoulli de
paramètre 𝜋. Effectuer le choix correct parmi les trois propositions figurant dans chaque crochet
et remplacer les pointillés par ce choix :

1
a. La variable aléatoire 𝑃 = 𝑛 ∑𝑛𝑖=1 𝑋𝑖 est un estimateur convergent de 𝜋.

b. En augmentant la taille de l’échantillon, on améliore la précision de l’estimation de 𝜋.


Module : STATISTIQUE INFERENTIELLE Page 3 sur 6

Nom de l’étudiant : ................................................ Prénom : .......................................... Place : ................

EXERCICE 2 (7 POINTS)

1. Qu’est-ce qu’un intervalle de confiance ?

L’estimation par intervalles consiste à déterminer, à partir des données observables sur un échantillon
aléatoire prélevé d’une population, un intervalle de faible amplitude qui recouvre un paramètre inconnu
de cette population avec une forte probabilité.

2. Le fournisseur d’énergie PROBA souhaite estimer sa part de marché. A cet effet, 120 usagers
d’énergie sont sondés par son service commercial. On pose la question suivante à chacun
d’eux : « Quel est votre fournisseur d’énergie ? ». Les réponses sont codées de la manière
suivante :
• Fournisseur PROBA = 1
• Fournisseur STAT = 2
• Fournisseur INFO = 3
Les réponses fournies par les 120 usagers interrogés sont les suivantes :
2111132212
1211221112
1132132123
1131312111
1232131322
1112132211
1113331112
1112231112
1112223333
3332223332
3332323333
3 332223332

a. Quelle est la population étudiée ?

La population est composée de tous les clients du fournisseur d’énergie.

b. Quel est l’échantillon étudié ?

L’échantillon est composé des 120 clients sondés.

c. Quelle est la variable qualitative binaire étudiée ?

La variable binaire qui permet d’estimer la part de marché du fournisseur d’énergie PROBA est la
variable « Fournisseur d’énergie » qui prend la valeur 1 si le fournisseur d’énergie choisi est PROBA
et 0 si le fournisseur d’énergie choisi est STAT ou INFO.
.
d. Donner l’estimation ponctuelle de la part de marché du fournisseur PROBA.
46
La part de marché estimée est 𝑝 = 120 ≈ 𝟎, 𝟑𝟖 = 38%.
Module : STATISTIQUE INFERENTIELLE Page 4 sur 6

Nom de l’étudiant : ................................................ Prénom : .......................................... Place : ................

e. Déterminer l’intervalle de confiance à 95% puis à 99% de la part de marché du fournisseur


PROBA. Commenter.

• Intervalle de confiance à 95% :


46
Notons 𝜋 la part de marché inconnue. L’estimation de 𝜋 est 𝑝 = 120 ≈ 𝟎, 𝟑𝟖.

De ce fait, l’intervalle de confiance, à 95%, de la part de marché est :

0,38 × 0,62 0,38 × 0,62


𝜋𝜖 [0,38 − 1,96 × √ ; 0,38 + 1,96 × √ ]
120 120

C’est-à-dire 𝜋𝜖[𝟎, 𝟐𝟗 ; 𝟎, 𝟒𝟕]

Dans la population de clients, la part de marché inconnue est estimée, avec une
certitude de 95%, à 38% ± 9%.

• Intervalle de confiance à 99%

L’intervalle de confiance, à 99%, de la part de marché est :

0,38 × 0,62 0,38 × 0,62


𝜋𝜖 [0,38 − 2,5758 × √ ; 0,38 + 2,5758 × √ ]
120 120

C’est-à-dire 𝜋𝜖[𝟎, 𝟐𝟕 ; 𝟎, 𝟒𝟗]

Dans la population de clients, la part de marché inconnue est estimée, avec une
certitude de 99%, à 38% ± 11%.

On note que l’intervalle à 99% est beaucoup plus large (donc moins précis) que
l’intervalle à 95%.
Module : STATISTIQUE INFERENTIELLE Page 5 sur 6

Nom de l’étudiant : ................................................ Prénom : .......................................... Place : ................

EXERCICE 3 (10 POINTS)

1. Qu’est-ce qu’une hypothèse statistique ?

Une hypothèse statistique est une assertion au sujet d’une population ou de plusieurs populations
que l’on peut mettre à l’épreuve en tirant un échantillon ou plusieurs échantillons au hasard suivant
le cas.

2. On dispose de 15 parcelles de terre choisies de manière aléatoire et simple dans une exploitation
agricole. On divise chacune d’elle en deux moitiés que l’on traite avec deux doses d’engrais azoté,
l’une forte et l’autre faible. Les résultats (exprimés en quintaux par hectare de blé récolté) sont les
suivants.

Parcelles 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X (Dose forte) 12,4 11,1 13,1 12,4 15,4 14,2 11,6 11,7 11,4 16,2 13,9 12,5 12,8 14 15,3
Y (Dose faible) 13,1 10,8 13,5 12,8 15,3 15,4 12 11,8 11,2 16,2 14,4 12,9 13,3 14,6 15

L’objectif est de vérifier, au travers d’un test d’hypothèses, si la différence moyenne des rendements est
significative.

a. Donner la formulation littérale des hypothèses.

H0 : les rendements moyens des parcelles traitées avec la dose forte et la dose faible sont les mêmes
{
H1 : les rendements moyens des parcelles traitées avec la dose forte et la dose faible sont différents

b. Donner la formulation statistique des hypothèses en indiquant explicitement les notations


utilisées.

H0 : 𝜇1 = 𝜇2
{ où 𝜇1 et 𝜇2 désignent respectivement les rendements des parcelles traitées avec la
H1 : 𝜇1 ≠ 𝜇2
dose forte et la dose faible.

c. Des tests préliminaires de normalité ont donné les résultats suivants :

Tests de normalité
Shapiro-Wilk
Statistiques ddl Sig.
X (Dose forte) 0,939 15 0,375

Y (Dose faible) 0,968 15 0,829

DIFF (X - Y) 0,935 15 0,322

Quel test paramétrique faudrait-il alors utiliser pour comparer les rendements moyens ?
Justifier votre réponse.

Test 𝒕 de Student pour échantillons appariés.


Module : STATISTIQUE INFERENTIELLE Page 6 sur 6

Nom de l’étudiant : ................................................ Prénom : .......................................... Place : ................

JUSTIFICATION : Deux variables quantitatives continues (les rendements respectifs des


parcelles traitées avec la dose forte et la dose faible) → Deux moyennes inconnues à comparer
(les rendements moyens des parcelles traitées avec la dose forte et la dose faible) → deux
échantillons aléatoires simples appariés. On se ramène par conséquent à un seul échantillon,
celui des différences de rendements. Cet échantillon est de petite taille (𝑛 = 15 < 30) → ces
différences de rendements sont distribuées suivant une loi normale (le test de normalité de
Shapiro-Wilk n’est pas significatif puisque la p-value = 0,322 > 5%) → la variance des
différences est inconnue → Test 𝒕 de Student pour échantillons appariés.

d. La « p-value » relative à ce test d’hypothèses vaut environ 0,019. La différence entre les
rendements moyens est-elle significative au seuil de 5% ? Justifier votre réponse.

La « p-value » étant inférieure à 5%, l’hypothèse nulle est donc rejetée au seuil de 5%. La
différence entre les rendements moyens est significative au seuil de 5%.

e. Estimer par intervalle la différence entre les rendements moyens en choisissant un niveau
de confiance de 95%. Retrouver la conclusion de la question d. en justifiant votre réponse.

L’intervalle de confiance (aléatoire) à 95% de 𝜇1 − 𝜇2 est :

𝑆𝐷 𝑆𝐷
̅−𝑡 𝛼
𝜇1 − 𝜇2 𝜖 ൤𝐷 × ̅+𝑡 𝛼
;𝐷 × ൨
1− ;𝑛−1 1− ;𝑛−1
2 √𝑛 2 √𝑛

0,42 0,42
Donc, 𝜇1 − 𝜇2 𝜖 [−0,29 − 𝟐, 𝟏𝟒𝟓 × ; −0,29 + 𝟐, 𝟏𝟒𝟓 × ] avec 𝑑̅ = 𝑥̅1 − 𝑥̅2 =
√15 √15
13,2 − 13,49 = −0,29 et 𝑠𝐷 = 0,42.

C’est-à-dire 𝜇1 − 𝜇2 𝜖[−𝟎, 𝟓𝟐 ; −𝟎, 𝟎𝟔]

On remarque que 𝟎 ∉ [−𝟑𝟑, 𝟗𝟐 ; 𝟏𝟔, 𝟐𝟐]. De ce fait, on rejette l’hypothèse nulle au seuil
de 5% et on conclut que la différence entre les rendements moyens est significative au
seuil de 5%.

Vous aimerez peut-être aussi