Vous êtes sur la page 1sur 23

LIntervalle de confiance

Jan-16

Fethi Derbeli

La signification des intervalles de confiance


Les statistiques telles que les dviations standard et la moyenne ne
sont que des estimations des valeurs Mu et Sigma et se basent sur
des chantillons.
Etant donn quil y existe une variabilit dun chantillon lautre,
nous pouvons quantifier cette incertitude laide des Intervalles de
Confiance bass sur les statistiques.
La plupart du temps, nous calculons des Intervalles de Confiance de
95% (IC).
Ces derniers sont interprts comme suit:
Environ 95 sur 100 IC contiennent le paramtre de population, ou
nous sommes certains 95% que le paramtre de population se
situe lintrieur de lintervalle.

Jan-16

Fethi Derbeli

La signification des Intervalles de Confiance


Si lon revient sur ce que nous venons de dire, nous avons
vu quenviron 95% de toutes les moyennes dchantillons
sont deux Erreurs Standard de la Moyenne de
population.
Nous pouvons donc dire que si nous prlevons un
chantillon au hasard dans un processus et en calculons la
moyenne, nous serons srs 95% dtre deux Erreurs
Standard du paramtre de population.

Jan-16

Fethi Derbeli

La signification des Intervalles de Confiance


Pratiquement:

Lintervalle de confiance (C.I.) est une fourchette de valeurs qui


inclue, avec une probabilit prdfinit nomm niveau de
confiance, la valeur relle des paramtres de la population
Statistiquement:

A [100 (1 - )]% intervalle de confiance des paramtres de la


population, mu ou sigma, est un intervalle alatoire:
Probabilit [Inf C.I. < < Sup C.I.] = 1 -
Probabilit [Inf C.I. < s < Sup C.I.] = 1 -

Cest quoi Alpha ()?

Le risque maximum ou probabilit de rejet de lhypothse nulle


quand il est vraie (connu aussi comme erreur type I ou niveau de
signification). Cette probabilit
Est toujours suprieur 0, et souvent tablit 5%.
Jan-16

Fethi Derbeli

Intervalles de confiance paramtriques


Les intervalles de confiance paramtriques prennent cette forme gnrale:
C.I. Statistiqu e / K *

s
n

quand :
C.I. Statistiqu e / - K * (erreur standard)
statistiqu e moyenne des chantillo n (x) or Ecart type des chnatillo n (s)
K Constante varie selon le type de la distributi on

Les intervalles de confiance refltent la variation de nos estimations ponctuelles


dun chantillon lautre.
Nous pouvons observer les Intervalles de Confiance pour:

X , sx ,Cp et Proportion de dfauts


Pour la moyenne, k est une valeur-t
Pour la dviation standard, k est une fonction de la distribution Chi au carr
Jan-16

Fethi Derbeli

Intervalles de Confiance paramtriques


Les intervalles de confiance paramtriques supposent une distribution-t des
moyennes dchantillons et utilisent ceci pour calculer les Intervalles de
Confiance.
La formule gnrale des Intervalles de Confiance Paramtriques pour la
moyenne est:

x t / 2 , n 1

s
n

x t / 2 , n 1

s
n

x Moyenne des chantillo ns


s standard deviation des chantillo ns
n Nombre des chantillo ns
t 2n -1 t - valeur de la probabilit it /2 et n - 1 degrs de libert

La distribution de rfrence ici est la distribution-t. Les distributions-t


reprsentent une famille de distributions en forme de cloche caractrises par la
taille de lchantillon.
Jan-16

Fethi Derbeli

Quest-ce que la distribution-t ?


La distribution-t est une famille de distributions (normales) en forme de
cloches qui dpendent de la taille de lchantillon.
Plus lchantillon est petit, plus la distribution est large et plate.
Pour avoir une ide des valeurs de t pour des intervalles de confiance
de 95% pour diverses tailles dchantillons, regardons le tableau ci-dessous:

Echantillon

Valeur-t

2.78

10

2.26

20

2.09

30

2.05

100

1.98

1000

1.96

Jan-16

Z-Distribution
(approx. n>30)

95% IC pour n=100

T-Distribution
(approx.
n<30)

T-dist
95% IC pour n=5
Fethi Derbeli

Distribution T vs. Distribution Normale


Utiliser la table t au lieu du table z pour calculer lair du queue
quand n<30
Note: Lair sous queue du distribution t est plus grand que
celle distribution z
Si s est inconnu, s est la meilleures estimation
Normal Distribution
(n > 30)
T-Distribution
(n < 30)

t
z

T n 1
Jan-16

s/ n

Si n > 30
Si n < 30
Fethi Derbeli

x
/ n
8

Que signifie cette formule complexe ?


Souvenez-vous, pour un IC de 95%, on peut en gnral utiliser
+/- 2 Sigma autour dune moyenne. Si nous connaissions le Sigma de
la population, la formule prcdente :

x t / 2 ,n 1

s
n

x t / 2 ,n 1

s
n

serait raccourcie comme ceci:

x 2

s
n

x 2

s
n

car la valeur Mu de la population est 2 dviations standard de la moyenne


dchantillon.
Jan-16

Fethi Derbeli

Intervalle de Confiance pour la moyenne


Quand nous estimons la performance du processus, nous le faisons sur la base dun
chantillon relativement restreint.
Voyons dabord lIntervalle de Confiance pour la Moyenne. Supposons que nous
voulions dterminer lIntervalle de Confiance de 95% pour la moyenne partir de 10
chantillons dun racteur. Prlevons des chantillons dans le racteur et nous
obtenons:
Moyenne = 249,6
Sigma = 14,15
n = 10
partir des donnes suivantes:
263.1 249.2 247.4 263.7 262.4 255.6 252.4 251.5 227.3 223

x - t /2, n- 1
Jan-16

s
s
x t /2, n- 1
n
n
Fethi Derbeli

10

Exercice
Example: Supposons quon veut dterminer les paramtre 95% comme IC pour
la moyenne de la population partir de 10 chantillons (n=10),
La moyenne des chantillons est de 249,56
lcart type est de = 14.15

x - t /2, n- 1

s
s
x t /2, n- 1
n
n

14.15
14.15
249.56 2.262 *
10
10
249.56 10.11 249.56 10.11
239.43 259.69
249.56 2.262 *

Solution: Nous somme confiant 95% que la moyenne est entre deux valeurs
239.43 et 259.69

Jan-16

Fethi Derbeli

11

Exemple Utilisant Minitab

Ouvrir fn: 1sample.mtw


Stat > Basic Statistics > 1-sample T

Jan-16

Fethi Derbeli

12

Exemple avec Minitab

Les Resultats sont affiches dans la cession window


One-Sample T: Process Yield
Variable
Process Yield

N
10

Mean
249.560

StDev
14.151

SE Mean
4.475

95% CI
(239.437, 259.683)

Cette rsultat vaut dire nous sommes 95% sr que la


moyenne actuel du processus est entre 239.4 et 259.68.
Nous avons pris un risque de 5% davoir tort.

Jan-16

Fethi Derbeli

13

C.I. pour sigma Population


Exemple: Supposant on prend un chantillons de f 16
valeurs et une deviation standard de 1.66. Le dgrs de
libert (n-1) est 16-1 ou 15. Avec ces donnes, on peut
utiliser la formule de lintervalle de confiance pour
estimer le sigma de la population.

n 1
n 1

s
2
/2
12/2

Ou :
1 % confiance
n taille' chantillo n
Jan-16

Basic Stats - 14Fethi Derbeli

14

C.I. pour Sigma Population


Example:
Note that the 2 distribution is not symmetrical, so the value
on either side of the confidence interval is different.
1.66

1.66

1.66

16 1
2
.05/2

16 1
2
.025

1.66

1.66

16 1
12.05/2

16 1
2
.975

15
15
1.66
27.49
6.26

1.23 2.57
Jan-16

Basic Stats - 15Fethi Derbeli

15

Exercise
Question: On suppose quon collecte six chantillons du processus et on a
calcul sigma 3.6. quel est CI de 95% ?

n 1

___

2
/2

n 1
12/2

___ 1
___ 1
___
___
___

2.23 8.82
Conclusion: On a prdit que 95% des chantillons vont avoir une deviation
standard entre 2.23 and 8.82, ou nous sommes confiant que 95% que la
deviation standard du processus va tre entre 2.23 et 8.82.

Jan-16

Basic Stats - 16Fethi Derbeli

16

Exercise - Solution
s

n 1

2
/2

n 1
12/2

6 1
6 1
3.6
3.6
2
.025
.2975
5
5
3.6
3.6
12.83
.83
3.6(.62) 3.6(2.45)
2.23 8.82
Jan-16

Basic Stats - 17Fethi Derbeli

17

Exemple Utilisant Minitab


Utilisant les data du fn: Multiwt2.mtw, on veut
calculer le IC de 95% pour la variation du poids de
bl du Pickup.
Les variables de sortie en C14.
Stat > Basic Statistics > Display Descriptive Statistics
Click Graphs Button
Graphical Summary
Enter Confidence Level

Jan-16

Basic Stats - 18Fethi Derbeli

18

Minitab Output

Que veut dire ces valeurs ?


Jan-16

Basic Stats - 19Fethi Derbeli

19

Exercice
s
Question: Supposon quon collecte
six chantillons dun process et on
calcul son cart type sigma de
3.6. quel est la IC de 95% . ?

n 1

2
/2

n 1
12/2

6 1
6 1
3.6
3.6
2
.025
.2975
5
5
3.6
3.6
12.83
.83
3.6(.62) 3.6(2.45)
2.23 8.82

Jan-16

Fethi Derbeli

20

Rsum
Les dfauts sont d'habitude plus faciles mesurer et
enregistrer que la probabilit de chaque opration d'un procd
Si les dfauts sont utiliss pour prvoir les niveaux de qualit, il
faut collecter des donnes long terme.
Le calcul des occurrences est un outil utile permettant de dfinir
les priorits des activits d'amlioration complmentaires
lorsqu'une entreprise a atteint un niveau de qualit globalement
lev (5.0 Sigma).
En gnral, les dfauts augmentent les temps de cycle, les
cots, les travaux en cours et le stock des produits finis. De
plus, ils restreignent les capacits.

Jan-16

Fethi Derbeli

21

Conclusions
Les Statistiques nous permet de comprendre nos processus de
manire prvoir le futur au lieu de dtecter les problmes
Nous donne une image de ce qui se passe dans nos processus
Nous permet de comprendre le comportement de la population
travers des chantillons
Nous permet de prendre des dcision un certain niveau de
confiance
Comprendre la capabilit actuelle du processus et se prendre les
bonnes dcision et choix pour lamliorer ulterieurement

Jan-16

Fethi Derbeli

22

Questions?

Jan-16

Fethi Derbeli

23