Vous êtes sur la page 1sur 20

T.K.

/2023

Corrigé TD Estimation des Moyennes et des Proportions

Remarque générale : Si N > 30 (grands échantillons), le quantile utilisé est , en référence

à la loi normale, alors que si N< 30 (petits échantillons), le quantile correspondant est. , en
référence à la loi de Student.

Exercice 1

Il n’y a pas de définition unique et exacte de l’intervalle de confiance. Cependant, on peut en


proposer deux qui explicitent le mieux cette notion :

Définition 1 : Un intervalle de confiance est un intervalle qui encadre une valeur réelle
(population) que l’on cherche à estimer à partir de valeurs obtenues de façon aléatoire
(échantillons).

Définition 2 : Un intervalle de confiance est la probabilité qu’il contienne la statistique


(moyenne ou proportion) de la population à partir de la statistique (moyenne ou
proportion) d’un échantillon.

1
Exercice 2

On suppose que la moyenne M suit une loi normale N (m , σ) tel que :


P (-Uα ≤ M ≤ Uα) = (1 – α)% et la proportion P suit également une loi normale N (fe).

Dans cet exercice, on vous demande de trouver les valeurs de Uα pour chaque cas, connu, de
(1 – α)% et trouver les encadrements (intervalle de confiance) de M et P pour chaque cas.

Remarque : Pour résoudre cet exercice, il faut se référer au cours « Loi


Normale » étudié en 1ère année.

P (-Uα ≤ M ≤ Uα) = (1 – α)%


=> P (M ≤ Uα) – P (M ≤ -Uα) = (1 – α)%
=> P (M ≤ Uα) – P (M ≥ Uα) = (1 – α)% (par symétrie : P(M ≤ -Uα) = P(M ≥ Uα)
=> P (M ≤ Uα) – [ 1 – P (M ≤ Uα) ] = (1 – α)%
=> P (M ≤ Uα) – 1 + P (M ≤ Uα) = (1 – α)%
=> 2 P (M ≤ Uα) – 1 = (1 – α)%. Or : P (M ≤ Uα) = F(Uα)
=> 2 F(Uα) – 1 = (1 – α)%
=> 2 F(Uα) = 1 + (1 – α)%
En divisant par 2 toute l’égalité, on aura donc :

Remarque : Cette formule établit une relation entre Uα et le seuil de


sécurité (1 – α)%. Pour cela, on aura également besoin de la table de la
loi normale centrée réduite afin d’effectuer les différentes lectures.
2
CAS 1 : (1 – α)% = 50%

=> F(Uα)= 0.5 + 0.5 x (1 – α)%

F(Uα)= 0.5 + 0.5 x 50%


F(Uα)= 0.5 + 0.5 x (0.5) = 0.75 => Uα = 0.68

Pour (1 – α)% = 50% => Uα = 0.68

CAS 2 : (1 – α)% = 90%

=> F(Uα)= 0.5 + 0.5 x (1 – α)%

F(Uα)= 0.5 + 0.5 x 90%


F(Uα)= 0.5 + 0.5 x (0.9) = 0.95 => Uα = 1.65

Pour (1 – α)% = 90% => Uα = 1.65

CAS 3 : (1 – α)% = 95%

=> F(Uα)= 0.5 + 0.5 x (1 – α)%

3
F(Uα)= 0.5 + 0.5 x 95%
F(Uα)= 0.5 + 0.5 x (0.95) = 0.975 => Uα = 1.96

Pour (1 – α)% = 95% => Uα = 1.96

CAS 4 : (1 – α)% = 99%

=> F(Uα)= 0.5 + 0.5 x (1 – α)%

F(Uα)= 0.5 + 0.5 x 99%


F(Uα)= 0.5 + 0.5 x (0.99) = 0.995 => Uα = 2.58

Pour (1 – α)% = 99% => Uα = 2.58

On sait que :

4
(1 – α)% 50% 90% 95% 99%
Uα 0.68 1.65 1.96 2.58

M∈

P∈

F∈

Dans le tableau ci-dessus, nous avons consigné tous les cas de figure de la transcription d’un
intervalle de confiance d’une moyenne, d’une proportion et d’une fréquence en fonction des
différentes valeurs de Uα (0.68, 1.65, 1.96 et 2.58) correspondant, respectivement, aux
seuils de sécurité de 50, 90, 95 et 99%. Bien entendu, les autres données sont
inconnues et leur écriture restera donc générale.

5
Exercice 3

Soit les données suivantes


n = 102
X : variable qui désigne la note de math
Σxi = 665 Σxi2 = 5577.5

1) Calculer la moyenne « m » (ou x̄) et l’écart-type σ :

2) Donner l’intervalle de confiance de la moyenne de math au risque de 5% :

La moyenne de l’échantillon x̄ = 6.51


La moyenne de la population s’écrit comme suit (ici N > 30) :

6
Application numérique :

- x̄ = 6.51
- Uα = 1.96
- σ = 3.52
- n= 102

Donc : X̄ = x̄ ± (Uα. σ)/ = 6.51 ± (1.96x3.52)/10.09 = x̄ ± 0.68

X̄ = x̄ ± 0.68 = X̄ = 6.51 ± 0.68 (1)

X̄ [ x̄ - 0.68 , x̄ + 0.68] = [ 6.51 – 0.68 , 6.51 + 0.68] = [ 5.83 , 7.19]

X̄ [ 5.83 , 7.19] (2)

5.83 ≤ X̄ ≤ 7.19 (3)

(1) , (2) et (3) sont les trois façons d’écrire un intervalle de confiance.

3) Calculer l’amplitude A de l’intervalle de confiance :

Rappelons que l’amplitude A d’un intervalle de confiance est la distance entre la valeur de la
borne supérieure de l’intervalle et la valeur de la borne inférieure de l’intervalle.

X̄ [ Borne < , Borne > ] => Amplitude A = A = Borne > - Borne <

A = Borne > - Borne <

7
Application numérique :

Amplitude = A = 1.36

4) Soit le coefficient de précision CP = 15%, calculer le risque d’erreur α


correspondant :

Rappel : Le coefficient de précision, noté CP et exprimé en %, désigne le degré de précision de


l’intervalle de confiance. Comme c’est l’amplitude A qui détermine la largeur de l’intervalle de
confiance et que, par ailleurs, le CP s’écrit en fonction de l’amplitude (voir la formule ci-dessous
du CP), il ressort, par conséquent, que plus A est grand, plus le CP est grand, plus la précision de
l’intervalle de confiance diminue. Et comme, A dépend de la variance (donc de l’écart-type) et
de l’effectif de l’échantillon « n », plus la variance est grande, plus le A est grand, plus le CP est
grand. En revanche, lorsque le « n » est grand et que la variance est petite, A devient faible, et
donc, un CP faible, et plus la moyenne de l’échantillon x̄ se rapproche de la moyenne de la
population X̄. Dans ce dernier cas, on aurait : n = N.

On a la relation suivante (1) :

Or, la formule de l’amplitude est ainsi formulée (2) :

8
De (1) et (2) on a :

Donc :

Application numérique :

Uα =

D’après la loi normale, on a :

9
Application numérique :

(1 – α) % = 83.54% => seuil de sécurité


=> seuil de risque α% = 100 – (1 – α) % = 100 – 83.54 = 16.46%

Donc, pour avoir un CP de 15%, il faudra considérer un risque de 16.46%

La lecture sur la table de la loi normale centrée réduite (lire le croisement de 1.3 en ligne et
0.09 en colonne) donne F(1.39) = 0.9177

5) Calcul d’un intervalle de confiance pour une proportion :

On donne :
- n = 1020 (effectif de l’échantillon)
- r = 380 (effectif des étudiants portant le groupe sanguin O - GSO)

Le pourcentage des étudiants GSO de l’échantillon :

PGSO(%) = 37.25%

Calcul de l’intervalle de confiance d’une proportion (ou d’une fréquence) :

Comme pour la moyenne, on peut également calculer l’intervalle de confiance d’une proportion
d’un échantillon afin de pouvoir déterminer celui de la population.

10
I.C. de PGSO(%) = pGSO(%) ± « erreur » ou « précision »
FGSO = fGSO ± « erreur » ou « précision »

Avec PGSO(%) = proportion du GSO de la population des étudiants


PGSO(%) = proportion du GSO de l’échantillon des étudiants
FGSO = fréquence du GSO de la population des étudiants
fGSO = fréquence du GSO de l’échantillon des étudiants

= 37.25 (%) ± 1.51

PGSO(%) = 37.25 (%) ± 1.51

On peut aussi écrire l’intervalle de confiance ainsi :

Pmasculin(%) ∈ [ 37.25 – 1.51 , 37.25 + 1.51]

=> PGSO(%) ∈ [ 35.74 , 38.76 ]

On peut aussi écrire l’intervalle de confiance ainsi :

35.74 ≤ PGSO(%) ≤ 38.76

11
On peut également exprimer les résultats comme suit :

= 0.3725 ± 0.0151

FGSO = 0.3725 ± 0.0151


OU
FGSO ∈ [0.3725 – 0.0151 , 0.3725 + 0.0151]

=> FGSO ∈ [ 0.3574 , 0.3876]

OU
0.3574 ≤ FGSO ≤ 0.3876

Calculer le coefficient de précision pour les proportions :

Le coefficient de précision CP calculé au seuil de sécurité de 95% pour le pourcentage du GSO


des étudiants est de :
CP = 15.89
12
%
6) Soit un intervalle de confiance de proportion au risque de 5% d’un autre échantillon
I.C. = [27.351. , 27.42]
Trouver la taille de l’échantillon.

On sait que :

Avec :

Donc :

13
Exercice 4

Soit les données du tableau suivant :

Echantillons 1 2 3 4 5 6 7 8 9 10
Dosages (g/l) 0.96 1.04 1.08 0.92 1.04 1.18 0.99 0.99 1.25 1.08

1) Estimer la moyenne de cet échantillon :

Estimer la statistique (une moyenne ou une proportion) d’un échantillon consiste à calculer la
valeur ponctuelle de ladite statistique.

2) Estimer la moyenne de cet échantillon par un intervalle de confiance à 95% :

On rappelle ici que N < 30, la variable suit donc la loi de Student de paramètre ddl = n – 1.

14
Exercice 5

La question est : quelle taille de l’échantillon « n », le psychologue doit-il considérer pour que
l’erreur d’estimation de la moyenne du temps de réaction x̄ ne doive pas excéder 0.01 seconde
aux seuils de sécurité de 95 et 99% (respectivement aux seuils de risque de 5 et 1%).

On donne σ = 0.05 s

Remarque importante : En réalité, ici, le terme d’ « erreur » est inapproprié car il s’agit plutôt
d’une « précision » due au caractère aléatoire de l’échantillon (Voir exercice 1).

En effet, la transcription de l’estimation de la moyenne du temps de réaction sera ainsi


présentée :

0.01 s 0.01 s
Si l’erreur ne doit pas excéder 0.01 s => erreur ≤ 0.01 s =>

15
a) Calculer « n » au risque de 5% pour que l’erreur ≤ 0.01 s :

Erreur ≤ 0.01 s => => Uα. σ ≤ 0.01 . => (1)

On élève au carré la relation (1) :

Donc, pour que l’erreur de l’estimation de la moyenne n’excède pas 0.01 s au risque de 5%, il
faudra que le psychologue teste un échantillon de, au moins, n = 96.04 personnes.

Remarque : Bien entendu, comme on ne peut pas diviser une personne en 0.04, on peut
considérer l’entier ou l’arrondi de 96.04 qui devient 96.

b) Calculer « n » au risque de 1% pour que l’erreur ≤ 0.01 s :

On reprend ici exactement le même raisonnement et les mêmes étapes que précédemment, sauf
que le Uα correspondant au risque de 1% devient 2.58 (au lieu de 1.96 pour le risque de 5%).

On aura donc : n ≥ 166.41

Donc, pour que l’erreur de l’estimation de la moyenne n’excède pas 0.01 s au risque de 1%, il
faudra que le psychologue teste un échantillon de, au moins, n = 166.41 personnes.

Remarque : Bien entendu, comme on ne peut pas diviser une personne en 0.41, on peut
considérer l’entier ou l’arrondi de 166.41 qui devient 166.

16
Exercice 6

X : est une variable désignant la teneur en glucose dans le sang


X : est une variable qui suit la loi normale => X : N (x̄ , σ) avec : x̄ = 1g et σ = 0.2g

Remarque : Pour résoudre cet exercice, il faut faire appel à vos connaissances acquises en 1 ère
année sur la Loi Normale.

1) Calculer P (0.7 ≤ X ≤ 1.2) :

P (0.7 ≤ X ≤ 1.2) = P(X ≤ 1.2) – P(X ≤ 0.7)

Pour passer de la loi normale N (x̄ , σ) à la loi normale centrée et réduite N (0 , 1), on opère un
changement de variable X en U, tel que :

On aura donc :

P (0.7 ≤ X ≤ 1.2) = P(X ≤ 1.2) – P(X ≤ 0.7) =

17
La probabilité pour un individu d’avoir une glycémie comprise entre 0.7 et 1.2 est :

P (0.7 ≤ X ≤ 1.2) = 0.7745 = 74.45%

2) Sur 1 000 personnes examinées, combien en moyenne auront une glycémie comprise
entre 0.7 et 1.2g :

On a calculé précédemment que la probabilité qu’une personne ait une glycémie comprise entre
0.7 et 1.2 est de 0.7745, c’est-à-dire qu’une personne a 74.45% de chances d’avoir une glycémie
comprise entre 0.7 et 1.2. Cela signifie que sur 100 personnes, 74.45 auront une glycémie
comprise entre 0.7 et 1.2g. Donc, sur 1000 personnes, on aura
10 x 74.45 = 744.5 personnes qui auront une glycémie comprise entre 0.7 et 1.2g.

On peut également répondre à cette question par une simple règle de trois :

Sur 100 personnes --------------------> 74.45 ont une glycémie [0.7 , 1.2]
1000 personnes-------------------------> Z ont une glycémie [0.7 , 1.2]

18
3) Calculer x̄ :

On donne un intervalle de confiance calculé pour un nouvel échantillon dont on vous donne les
indications suivantes : n > 30 et Var(x) = 0.09 g2 => σ = 0.3 g

I.C2 = [ 1.14 , 1.26 ]

On sait qu’un Intervalle de Confiance est centré sur x̄.

Donc :

x̄ = 1.2g

4) Calculer l’effectif « n » au seuil de risque de 5% :

X̄ [ Borne < , Borne > ] => Amplitude A = Borne > - Borne <

Donc :

19
On sait que :
Borne > I.C = 1.26
Borne < I.C = 1.14
Amplitude A = Borne > - Borne < => A = 1.26 – 1.14 = 0.12

Application numérique :

L’effectif de cet échantillon est de n = 96

20

Vous aimerez peut-être aussi