Vous êtes sur la page 1sur 6

L’intervalle de confiance

La moyenne que l’on obtient suite à une enquête (sondage) sert de mesure dans un
processus de décision. On nomme ce résultat « point estimate » en anglais ou estimé
ponctuel en français. On la nomme ainsi puisque la moyenne obtenue lors d’une enquête
ne représente qu’un seul résultat parmi tous les résultats possibles ou encore de tous les
échantillons possibles. Il existe donc un danger d’utiliser la moyenne obtenue dans un
sondage et de conclure qu’il s’agit de la seule valeur fiable. Il est donc plus prudent de
calculer un intervalle de confiance.

Supposons une population (N) de 5 étudiants. Nous voulons connaître le budget


hebdomadaire pour un certain produit à partir d’un échantillon de 2 étudiants 1.
Techniquement, il est possible d’avoir 10 échantillons différents de 2 étudiants sur un
total de 5 étudiants. On obtient ce nombre en calculant 5NcR2 (Nous pouvons également
écrire 5C2 ou 5C2, le C indiquant le mot combinaison). Supposons les résultats suivants :

Ech. 1 Ech. 2 Ech. 3 Ech. 4 Ech. 5 Ech. 6 Ech. 7 Ech. 8 Ech. 9 Ech. 10
Étudiant 1 65 65 65 65
Étudiant 2 61 61 61 61
Étudiant 3 62 62 62 62
Étudiant 4 67 67 67 67
Étudiant 5 69 69 69 69
Moyenne 63 63,5 66 67 61,5 64 65 64,5 65,5 68
Moyenne (µ) 64,8
ET 2,8284 2,1213 1,4142 2,8284 0,7071 4,2426 5,6569 3,5355 4,9497 1,4142
Fact de corr 0,7746 0,7746 0,7746 0,7746 0,7746 0,7746 0,7746 0,7746 0,7746 0,7746
N 5
n 2
s/racine n 2 1,5 1 2 0,5 3 4 2,5 3,5 1
Erreur 1,5492 1,1619 0,7746 1,5492 0,3873 2,3238 3,0984 1,9365 2,7111 0,7746
interval 95% 3,0364 2,2773 1,5182 3,0364 0,7591 4,5546 6,0728 3,7955 5,3137 1,5182
Intervalle - 59,9636 61,2227 64,4818 63,9636 60,7409 59,4454 58,9272 60,7045 60,1863 66,4818
Intervalle + 66,0364 65,7773 67,5182 70,0364 62,2591 68,5546 71,0728 68,2955 70,8137 69,5182

L’estimateur est représenté par la moyenne. On remarque qu’aucune des moyennes


provenant des 10 échantillons n’est identiques. Alors si nous utilisons une de ces
moyennes et que nous disons que cette dernière est identique à la moyenne dans la
population, nous commettrions une erreur. La « vrai moyenne » pour cette population est
64,8 (voir la ligne Moyenne (µ) dans le tableau). Il est donc important de calculer un

1
On aura compris qu’il s’agit d’une démonstration du principe.
intervalle à l’intérieur de laquelle la « vrai » moyenne se retrouve. Le calcul de
l’intervalle se fait comme suit :

Premièrement on doit calculer l’erreur de l’estimateur. L’estimateur, dans ce cas-ci, est la


moyenne obtenue à partir de l’échantillon. L’erreur est obtenue par la formule suivante :

 n s
 y = 1
N n

Ici  y indique l’erreur obtenue à partir de la moyenne de l’échantillon (le y indique qu’il s’agit
de la moyenne arithmétique);

n représente la taille de l’échantillon (pour notre exemple 2)

N représente la taille de la population (pour notre exemple 5)

s représente l’écart type de l’échantillon



En ayant  y il est possible de calculer l’intervalle. Nous obtenons l’intervalle par l’équation
suivante : y  Zˆ y    y  Zˆ y

Comme la distribution des résultats suit une courbe normale il est possible d’utiliser le Z.
Par exemple, si on désire obtenir un intervalle de 95% on utilisera un Z de 1,96. En effet,
en consultant la table du Z on obtient un pourcentage sous la courbe de 47,5% avec un Z
de 1,96. Aussi ± 1,96 nous donne 47,5 + 47,5 ou 95%. Pour l’intervalle, il est possible
d’utiliser un Z de 2 (qui nous donne une valeur de 47,72% ou un intervalle total de
95,44%). Donc pour un intervalle de 95% nous pouvons utiliser la formule suivante :
y  2ˆ y    y  2ˆ y

Ceci indique que qu’avec une probabilité à 95% la « vrai » moyenne (µ) se situe entre le
résultat de la moyenne de l’échantillon et ±2 fois l’erreur de l’estimateur. (C’est ce que
l’on retrouve dans le tableau ci-haut.

Le tableau doit donc se lire comme suit :

- On retrouve les dix échantillons sous les colonnes « Ech ». La moyenne


représente la moyenne de l’échantillon.

- La moyenne (µ) représente la moyenne de la population. On obtient cette dernière


en additionnant la réponse de chacun des étudiants ou encore en utilisant la
moyenne de la moyenne pour chaque échantillon. Le chiffre 64,8 représente donc
la vraie moyenne. On remarque qu’aucun échantillon ne nous donne exactement
une moyenne de 64,8!
- ET représente l’écart type (s).

n
- Fact de Corr représente le facteur de correction ( 1  ).
N

- n représente le nombre d’observations.

- s/racine de n représente l’erreur de l’estimateur (sans le facteur de correction).



- Erreur représente l’erreur de l’estimateur (  y ) avec le facteur de correction.


- Intervalle 95% représente l’erreur de l’estimateur telle que Z±(  y ) pour 95% le Z
= 1,96. Nous avons donc 1,96 (erreur). (Nous avons utilisé 1,96 et non 2 pour
l’exemple).

- Intervalle – représente le résultat de l’échantillon (la moyenne ici) moins (-)



1,96(  y ).

- Intervalle + représente le résultat de l’échantillon (la moyenne ici) plus (+)



1,96(  y ).

Donc pour l’échantillon 1, nous avons une moyenne de 63 et nous estimons que
l’intervalle à 95% se situe entre 59,96 et 66,04. La « vrai » moyenne de 64,8 se
retrouve à l’intérieur de l’intervalle.
Exemple :

La chaîne de restauration McDonald’s diffuse la valeur nutritive de ses produits 2. Le


sandwich junior au poulet est supposé contenir 380 calories. Supposons qu’un groupe de
protection des consommateurs conteste ce chiffre et prend un échantillon de 10
sandwichs (n=10) à partir d’un lot de 300 sandwichs (N=300) et obtient les résultats
suivants au niveau de la valeur calorique de chacun de ces sandwichs3 : 380; 384; 386;
378; 385; 387; 379; 385; 389; 380.

Sandwich junior au
poulet 132g 380 20 31 3,5 0,2 19 35 760 32 38 13 2 8 5 12 2 2 10 20

- Estimez l’erreur type de l’estimateur;

RÉPONSE : L’erreur type de l’estimateur est le sigma chapeau et la formule est la


n s
suivante: ˆ y  1 
N n

Nous devons donc en premier calculer l’écart type (s). Ceci peut se faire facilement via
EXCEL.

Voici les résultats :

Calories
380
384
386
378
385
387
379
385
389
380
Moyenne 383,3
Ecart type 3,77270902

2
http://www1.mcdonalds.ca/NutritionCalculator/NutritionFactsFR.pdf

3
Ces chiffres sont fictifs
CV 0,00984271

Déterminer, avec un intervalle de confiance à 95%, la valeur calorique du sandwich.

Réponse :

Pour déterminer l’intervalle de confiance on doit, en premier lieu, calculer ̂ y . Avec les
données que nous avons on obtient :
n s
ˆ y  1  =
N n

10 3,7727
1 =
300 10

3,7727
1 0,03333 =
3,16227766

0,96666 *1,193032... =

0,98318869 * 1,193032 = 1,1729

Comme la moyenne est de 383,3 il est possible de calculer l’intervalle à 95% de la façon
suivante :

  ou y  Z ˆ     y  Z ˆ 
y  Z ̂ y y y

Ou :

y = la moyenne de l’échantillon (pour le problème 383,3)


Z = la valeur de Z qui équivaut à ± l’intervalle (pour le problème 1,96)
̂ y = l’erreur type de l’estimateur (pour le problème 1,1729)
 = la moyenne de la population (pour le problème 380)

Ici nous demandons un intervalle à 95%. En allant dans la table du Z nous observons
qu’un Z de 1,96 = 47,5%. Donc ± un Z de 1,96 donne 95% (47,5% + 47,5% = 95%).4

4
Dans le document remis en classe on utilise un Z de 2.
Nous aurons donc pour notre problème :

 
y  Z ˆ y    y  Z ˆ y  =
383,3  1,961,1729  380  383,3  1,961,1729 =
383,3  2,29888  380  383,3  2,29888 =
381,00  380  385,30

Ainsi, la moyenne calorique des sandwichs, tel que publiée, par la compagnie ne se situe
pas dans l’intervalle puisque 380 ne s’y trouve pas.

Est-il juste de dire que la valeur calorique du sandwich est effectivement de 380 calories?

Réponse : Théoriquement non puisque le 380 n’est pas dans l’intervalle. Cependant, il
est question d’une seule calorie. Ce qui équivaut à quelques « gouttes » d’un condiment.
Il faut donc utiliser son jugement dans la conclusion.

En utilisant la moyenne, la médiane, le (ou les) mode(s), le CV et si vous êtes du groupe


de consommateur comment analysez-vous ce résultat et que concluez-vous?

Réponse : Le CV est petit ce qui indique que la moyenne est représentative de


l’échantillon (il n’y a pas d’écart majeur). De plus la moyenne, la médiane ainsi que les
deux modes sont très près un de l’autre. Ceci indique que McDonald sous évalue la
valeur calorique.

Et si vous êtes de la compagnie McDonald’s que répondez-vous?

Réponse : L’échantillon ne vient que d’un seul restaurant. Un équipement mal calibré
pourrait expliquer l’écart. La différence de 3 calories est plutôt marginale.

Vous aimerez peut-être aussi