Vous êtes sur la page 1sur 17

Génie Mécanique de Développement

PROBABILITÉ & STATISTIQUES


I Statistiques descriptive
II Probabilité Expérimentaux
Espace de probabilité
Fiabilité

III Variables Aléatoires


VI Lois de Probabilité Fonctions caractéristiques
Lois de type continue
Lois de type discret
Lois fondamentales en Statistiques
V Estimation
VI Test d’hypothèse
VII Régression & corrélation linéaires
VIII Introduction aux méthodes de simulation numériques
Documents de travail J.MAHFOUD 1

Génie Mécanique de Développement

TESTS

Introduction

Test de comparaison à un standard


L'objectif est : l'acquisition des
Tests des valeurs aberrantes
connaissances & des méthodes
nécessaires pour les Statistiques Tests d’adéquation de Loi:
Décisionnelles, établir un modèle de
comportement à partir de mesures - Graphiques
expérimentales. - Analytiques
Plusieurs tests existent. Ici nous allons
regarder une partie.
Test de comparaison de deux PN

Tests non paramétriques

Tests progressifs

Documents de travail J.MAHFOUD 2


1 Introduction

Quand on fait une hypothèse (Ho), il


y a deux possibilités:
1) Si on l’accepte; dans ce cas, soit on
a eu raison, ou on a eu tort, dans
ce dernier cas on a un risque
d’accepter cette hypothèse à tort,
2) Soit on la rejette; ici aussi soit on a
eu raison de ne pas l’accepter, ou
on a eu tort.
Donc, il faut calculer ces risques
(probabilités) et en fonction de ces
risques ON PREND une décision.

Documents de travail J.MAHFOUD 3

1 Introduction

Documents de travail J.MAHFOUD 4


1 Introduction

Documents de travail J.MAHFOUD 5

1 Introduction
Une question qui se pose souvent, est de
savoir quelle sensibilité a la procédure de
contrôle qualité en cours ? En d'autres
termes, quelle chance avons nous de ne
pas détecter un échantillon (par exemple,
une moyenne dans une carte X-barre) en
dehors des limites de contrôle (c'est-à-
dire d'accepter le processus de
production comme étant "sous contrôle",
alors qu'en fait, il a été sensiblement
décalé) ?
Les courbes d'efficacité sont
particulièrement utiles pour explorer la
puissance d'une procédure de contrôle
qualité. La décision finale concernant les
tailles d'échantillons doit dépendre du
coût de mise en œuvre du plan (par
exemple, le coût par élément
échantillonné), mais également du coût
résultant d'une non-détection de
problèmes de qualité. La courbe
d'efficacité permet à l'ingénieur d'estimer
les probabilités de ne pas détecter des
décalages d'une certaine taille dans la
production.
Documents de travail J.MAHFOUD 6
2 Test de comparaison à un standard

m ; σ ; Pr

Démarche

1- H0 : m = m0
H1 : m = m1 > m0

2- Seuil de signification α

3- Condition d'application
(σ0 connu ou pas)
(n grand ou pas)

4- La Statistique qui convient


Z T ou Khi2

5- Le domaine d'acceptation W : { mi ; ms }

6- Le risque β

7- Décision
Documents de travail J.MAHFOUD 7

2 Test de comparaison à un standard

Exemple

1 H0 : m = m0 = 28.4
2 1 − α = 0 .9 5
3 ε n → n = 20 ; PN → σ 0 = 0.3

Documents de travail J.MAHFOUD 8


3 Tests des valeurs aberrantes Estimation de la fonction de répartition

 X1  Y1 
X  Y 
 2  
ε n :   ⇒ ε n odroné :  2  ;Y1 < Y2 ; Yn V.A. la plus grande valeur mesurée
   
 X n  Yn 

L ( Xi ) ≡ L ( X )
On cherche FˆX ( x ) X i Variable Aléatoire Indép.

FYn ( x ) = Pr (Yn < x )

Yn est la plus grande valeur de l'εn ordonné


La probabilité que la plus grande valeur de l'εn
x > Yi ; x > X1 et X2 et ... X n ordonné soit inférieure à la réalisation x est
égale à la probabilité que la V.A., de la PN, X soit
Pr ( x > Yn ) = Pr ( x > X1 et X2 et ... X n ) au plus "égale" à cette réalisation à la
Pr ( x > Yn ) = FX 1 ( x ) ⋅ FX 2 ( x )....FXn ( x ) ; L ( X i ) ≡ L ( X ) puissance n (taille de l'εn)

FYn ( x ) = FX ( x ) 
n
FYn ( x ) = Pr (Yn < x ) = FX ( x ) 
n

Documents de travail J.MAHFOUD 9

3 Tests des valeurs aberrantes Estimation de la fonction de répartition

 X1  Y1 
X  Y 
 2  
ε n :   ⇒ ε n odroné :  2  ;Y1 < Y2 ; Y1 V.A. la plus petite valeur mesurée
   
 X n  Yn 

L ( Xi ) ≡ L ( X )
On cherche FˆX ( x ) X i Variable Aléatoire Indép.

FY1 ( x ) = Pr (Y1 < x ) = 1 − Pr (Y1 ≥ x )

Y1 est la plus petite valeur de l'εn ordonné

x ≤ Yi ; x ≤ X1 et X2 et ... X n
Pr ( x ≤ Y1 ) = Pr ( x ≤ X1 et X2 et ... X n )
Pr ( x ≤ Y1 ) = 1 − FX 1 ( x ) ⋅ 1 − FX 2 ( x ).. ⋅ ..1 − FXn ( x ) ; L ( X i ) ≡ L ( X )
FY1 ( x ) = 1 − Pr ( x ≤ Y1 ) = 1 − [1 − FX ( x ) ⋅ 1 − FX ( x ).. ⋅ ..1 − FX ( x ) ]

FY1 ( x ) = Pr (Y1 < x ) = 1 − 1 − FX ( x )  FY1 ( x ) = 1 − 1 − FX ( x ) 


n n

Documents de travail J.MAHFOUD 10


3 Tests des valeurs aberrantes Estimation de la fonction de répartition– Application1

L( X ) = W (β ;η ; δ )
β
 x −δ 
− 
FX ( x ) = 1 − e  η 

β n β
  x −δ 
− 
  x −δ 
− n 
FY1 ( x ) = 1 − 1 − FX ( x )  = 1 − 1 − 1 + e  η   = 1− e  η 
n

 
 
L (Y1 ) = W ( β ; η1 ; δ )

η
η1 = 1
β
n

β n
  x −δ 
− 

FYn ( x ) = FX ( x )  = 1 − e  η 
 
n

 
 
Documents de travail J.MAHFOUD 11

3 Tests des valeurs aberrantes Estimation de la fonction de répartition

 X1  Y1 
X  Y 
 2  
ε n :   ⇒ ε n odroné :  2  ;Y1 < Y2 ; Yk V.A. la k ième valeur mesurée
   
 X n  Yn 

L ( Xi ) ≡ L ( X )
On cherche FˆX ( x ) X i Variable Aléatoire Indép.

La réalisation x est supérieure à la kième valeur


FYk ( x ) = Pr (Yk < x ) de l'εn ordonné.
Donc il y a au moins k mesures inférieures à
cette réalisation (peut être plus).

FYk ( x ) = Pr ( K > k ) = 1 − Pr ( K ≤ k ) ; L ( K ) = B ( n; p ) ; p = FX ( x )

k
n!
FYk ( x ) = 1 − Pr ( K ≤ k ) = 1 − ∑ Cnj p j q n − j ; q = 1 − p ;Cnj =
j =0 j !( n − j )!

n n
FYk ( x ) = ∑ C p q = ∑ Cnj [FX ( x )] [1 − FX ( x )]
j j n− j j n− j
n
j =k j =k
Documents de travail J.MAHFOUD 12
3 Tests des valeurs aberrantes
Minimum des mesures

PN ; L ( X ) ; FX ( x ) = Pr ( X < x )

FY1 ( x ) = 1 − 1 − FX ( x ) 
n

Si on prélève un εn de cette PN , on peut avoir une idée (avec une certaine probabilité) de la possible
valeur minimale. Donc on peut dire également que pour une certaine probabilité si la valeur minimale
d'un εn ordonné est inférieure à une limite donnée, cette valeur peut être considérée comme
aberrante.

Pr (Y1 < xα ) = α = FY1 ( xα )

FY1 ( xα ) = 1 − 1 − FX ( xα )  = α
n

1
FX ( xα ) = 1 − [1 − α ]n

Documents de travail J.MAHFOUD 13

3 Tests des valeurs aberrantes


Maximum des mesures

PN ; L ( X ) ; FX ( x ) = Pr ( X < x )

FYn ( x ) = FX ( x ) 
n

Si on prélève un εn de cette PN , on peut avoir une idée (avec une certaine probabilité) de la possible
valeur Maximale. Donc on peut dire également que pour une certaine probabilité si la valeur
maximale d'un εn ordonné est supérieure à une limite donnée, cette valeur peut être considérée
comme aberrante.

Pr (Yn > x1−α ) = α = 1 − FYn ( x1−α )

FYn ( x1−α ) = FX ( x1−α )  = 1 − α


n

1
FX ( x1−α ) = [1 − α ]n

Documents de travail J.MAHFOUD 14


3 Tests des valeurs aberrantes Estimation de la fonction de répartition– Application2

FY1 ( y1 ) = 1 − 1 − FX ( y1 )  = 1 − α
n
FYn ( y n ) = FX ( y n )  = α
n

1 − FX ( y1 )  = α
n
1
FX ( y n ) = α n
1
FX ( y1 ) = 1 − α n

FX ( y1 )α = 1 − FX ( y n )1−α

FX ( y1+ k )α = 1 − FX ( y n − k )1−α

Documents de travail J.MAHFOUD 15

3 Tests des valeurs aberrantes


Maximum des mesures

STATISTIQUE DESCRIPTIVE

La taille des chercheurs dans un des laboratoire


Faire parler les mesures
de GMD en cm
177 162 171 164 167
Est-ce que l’ est représentatif? 167 169 162 168 173
168 177 170 177 176
162 175 163 173 182
Est-ce que les mesures sont justes? 166 178 180 192 178

Est-ce 192 est une valeur aberrante?


moyenne H G ecart type g1 g2
171,88 171,58 171,73 7,25 0,67 0,61
CV 0,04

Médiane 171

L(Taille)=N(172 ; 7.5)

Est-ce que cette hypothèse est juste?


Documents de travail J.MAHFOUD 16
3 Tests des valeurs aberrantes Estimation de la fonction de répartition
n n
Fy k ( x ) = ∑ C p q = ∑ Cnk [FX ( x )] [1 − FX ( x )]
k k n −k k n −k
n
j =k j =k

On cherche FˆX ( x ) ; FYk = ? FYk ( x ) = Pr (Yk < x )

Si n=6; xi= 70; 130; 120; 40; 160; 100 ; yi= 40; 70; 100; 120; 130; 160
6
FY3 ( y 3 ) = ∑ C36 [FX ( y 3 )] [1 − FX ( y 3 )]
3 6−k

j =3

Si FY3 ( y 3 ) = Pr (Y3 < y 3 ) = 0.1 Si FY3 ( y 3 ) = Pr (Y3 < y 3 ) = 0.9


FX (Y3 ) = 0.201 FX (Y3 ) = 0.667

Comment faire:
On définit un intervalle = 1-α Il y a donc 1- α chances que la fonction de répartition de
la kième valeur de l'εn ordonné soit dans cet intervalle.

A l'intérieur de cet intervalle, il nous faut une indication ponctuelle.


Comme la proba est une valeur entre 0 & 1, la fonction de répartition la kième valeur de l'εn ordonné
peut être n'importe quelle valeur entre 0 & 1, on choisit de prendre une valeur au milieu.
FYk(yk)=0.5 ; Estimation par rapport à la médiane. FX(yk)=(k-0.3)/(n+0.4)
Documents de travail J.MAHFOUD 17

3 Tests des valeurs aberrantes Estimation de la fonction de répartition

50% 10% / 90%

Nous souhaitons tester la Normalité d’un échantillon. Si on utilise directement la fonction de répartition
du modèle normal, ceci revient à accepter à priori l’hypothèse de normalité. Ici, tout ce que nous disons,
est qu’il y a 1-a chance que la fonction de répartition de la première valeur de cet échantillon ordonné
soit comprise entre F1-a/2 et Fa/2. Ensuite et en fonction de la réalisation on prendra une décision. Ceci est
vrai car la plus petite réalisation d’un échantillon de taille 6 issu d’un phénomène Normal sera forcement
différente de celle issue d’un phénomène exponentiel.
Documents de travail J.MAHFOUD 18
4 Tests d’adéquation de Loi

Documents de travail J.MAHFOUD 19

4 Tests d’adéquation de Loi


Méthodes graphiques

Le principe est simple, si on trace n


points sur un échelle linéaire, et si le
résultat est une droite, on pourra donc
conclure que cette série de mesure
correspond à Y=aX+b. Si ce n’est pas
une droite, tout ce que nous pouvons
dire, ce n’est pas issue de Y=aX+b.
Maintenant, je peux construire des axes
fonctionnels, par exemple linéaire en
X2, ou en fonction d’une fonction de
répartition d’un modèle donné. Et le
fait de rapporter ces point en fonction
de l’estimation de la fonction de
répartition et si le résultat suit (une
tendance) une droite, il est possible
donc de dire, rien n’empêche de
retentir l’hypothèse que cette série de
mesure est issue d’un phénomène qui
suit le modèle testé, sinon, on refait le
test avec un autre axe fonctionnel.
Documents de travail J.MAHFOUD 20
Le papier fonctionnel le plus simple
est celui du modèle Normal. Ici il faut
linéariser la fonction de répartition.
On ne peut pas exploiter facilement
la forme analytique de cette fonction,
mais on sait à partir des tables que
F(z)=une valeur entre 0 et 1, et z, bien
que théoriquement varie de – infini à
+ infini, la plage entre -5 et +5 couvre
pratiquement tout l’observable. Donc
on va linéariser en fonction de z (l’axe
vertical correspondra à la fonction de
répartition linéarisée). L’axe
horizontale sera libre et correspondra
aux valeurs des mesures.

Documents de travail J.MAHFOUD 21

Xi Yi f0,5

70 40 0,109
130 70 0,256
120 100 0,421
40 120 0,579
160 130 0,735
100 160 0,891

On tracera donc l’échantillon


ordonné dans ce papier
fonctionnel en fonction de
l’estimation de la fonction de
répartition. Ici ça sera par rapport
au rang médiane pour avoir une
« estimation » ponctuelle. Si la
tendance générale est une droite
(il n’y a pas de courbure), rien
n’empêche de retentir l’hypothèse
de modèle Normal, sinon on
change de papier

Documents de travail J.MAHFOUD 22


Xi Yi f0,5

70 40 0,109
130 70 0,256
120 100 0,421
40 120 0,579
160 130 0,735
100 160 0,891

Ici est un papier pour un modèle


Log-Normal, où on va rapporter la
même série de mesure avec les
mêmes valeurs de pour la
fonction de répartition.
Et pareil, si la tendance est une
droite donc la série peut être
considérée comme issue d’une
population qui suit une
distribution Log-Normal, sinon on
change de papier

Documents de travail J.MAHFOUD 23

Xi Yi f0,5

70 40 0,109
130 70 0,256
120 100 0,421
40 120 0,579
160 130 0,735
100 160 0,891

Comme un modèle de Weibull.


Ici la linéarisation est un peu
différente, car la fonction de
répartition est facilement
exploitable analytiquement,
donc on cherche à la mettre
sous la forme de Y=aX+b

Documents de travail J.MAHFOUD 24


4 Tests d’adéquation de Loi
Méthodes Analytiques

Grands échantillons
Test de KHI2

Petits (ou grands) échantillons


Test de Kolmogorov
(Lilliefors)

Documents de travail J.MAHFOUD 25

4 Tests d’adéquation de Loi


Test de KHI2

H0 : "Dans PN XV.A. suit la Loi FX"

PN εn
↓ ( groupé par classes )
dFX ↓
↓ ni
fi =
pi = Pr ( X ∈ [ xi ; xi +1[ ) / H0
n

Ni : V .A. : fréquence absolue de la ième classe


( Ni − n pi )
r = nb des classes 2
r
E= ∑i =1
Ei = ∑
i =1 n pi

Si :
n → ∞ groupé/classes ( ≈ 30) 
 si les paramètres sont connu χ r2−1
Ni ≥ 4 ou 5  ⇒ lim E
 si on estime k paramètres χ r2−1−k
Pi Pas "trop différents" 
Documents de travail J.MAHFOUD 26
4 Tests d’adéquation de Loi
fx
Test de KHI2

pi
( ni − n pi ) n 2 ( fi − pi )
2 2
n
= ( fi − pi )
2
Ei = =
n pi n pi pi fi
x
Démarches:
x
β xi xi +1
− 
1 − H0 = L ( X ) = W ( β ; η ; 0 ) ⇒ FX ( x ) = 1 − e µ

2 − ε n ⇒ groupé / classes
3 − pi = Pr ( X ∈ [ xi ; xi +1[ ) / H0 = FX ( xi +1 ) − FX ( xi )

( n − n pi )
2

4 − Ei = i
n pi
r
5 − E = ∑ Ei
1

6 − fixer 1− α
7 − Tables χ12−α ; ddl = r − 1 ou r − 1 − k
8 − E < χ12−α OK ; E > χ12−α H1
Documents de travail J.MAHFOUD 27

4 Tests d’adéquation de Loi classes ti ni fi


35
0 200 100 33 0,33
Test de KHI2 30

25
200 400 300 22 0,22
20
Attention plusieurs classes où l’effectif 400 600 500 14 0,14
15
est inférieur à 4 ou 5, donc on groupe 600 800 700 9 0,09 10

5
800 1000 900 6 0,06
0
1000 1200 1100 6 0,06 100 300 500 700 900 1100 1300 1500 1700 1900 2100

1200 1400 1300 1 0,01


1400 1600 1500 3 0,03 mi 526

1600 1800 1700 1 0,01 σ 506,48

1800 2000 1900 3 0,03 g1 1,47

2000 2200 2100 2 0,02 g2 1,54


Σ 100 1

Ho=EXP(526)
On fait l'hypothèse que le modèle est Exponentiel:
classes ni fi pi
x
− 
H0 = L ( X ) = W (1; η ; 0 ) ⇒ FX ( x ) = 1 − e
0 200 33 0,33 0,3163 µ
200 400 22 0,22 0,2163
400 600 14 0,14 0,1479
pi = Pr ( X ∈ [ xi ; xi +1[ ) / H0 = FX ( xi +1 ) − FX ( xi )
600 800 9 0,09 0,1011  200 
−    0 
− 
 200 
− 
 0 
− 
p1 = 1 − e  526 
−  1 − e  526   = e  526  − e  526  = 0.3136
800 1000 6 0,06 0,0691  
 
1000 1200 6 0,06 0,0473
( 33 − 100 X 0.3136 )
2
1200 1800 5 0,05 0,0695
E1 = = 5.9 X 10−4
1800 2200 5 0,05 0,0174 100 X 0.3136
Σ 100 1 0,9847 r

∑p
1
i = 0.9847
Documents de travail J.MAHFOUD 28
4 Tests d’adéquation de Loi classes ti ni fi
35
0 200 100 33 0,33
Test de KHI2 30

25
200 400 300 22 0,22
20
Le niveau de confiance est choisi 0.80. 400 600 500 14 0,14
15
nous avons estimé la moyenne et 600 800 700 9 0,09 10

après groupement on a 8 classes, 5


800 1000 900 6 0,06
donc on cherche dans la table de Khi2 0
1000 1200 1100 6 0,06 100 300 500 700 900 1100 1300 1500 1700 1900 2100
pour 0.80 et 8-1-1=6 ddl
1200 1400 1300 1 0,01
1400 1600 1500 3 0,03 mi 526

1600 1800 1700 1 0,01 σ 506,48

1800 2000 1900 3 0,03 g1 1,47

2000 2200 2100 2 0,02 g2 1,54


Σ 100 1

Ho=EXP(526)
classes ni fi pi pi' ej classes 8
0 200 33 0,33 0,3163 0,3163 5,93872E-04 Paramètres 1

200 400 22 0,22 0,2163 0,2163 6,49477E-05 n 6

400 600 14 0,14 0,1479 0,1479 4,17089E-04 α 0,2

600 800 9 0,09 0,1011 0,1011 1,21617E-03 KHI_2 8,558

800 1000 6 0,06 0,0691 0,0691 1,20193E-03


1000 1200 6 0,06 0,0473 0,0473 3,43814E-03
1200 1800 5 0,05 0,0695 0,0695 5,47072E-03
1800 2200 5 0,05 0,0174 0,0326 9,22595E-03
Σ 100 1 0,9847 1 2,16288E-02
e= 2,162881328
Documents de travail J.MAHFOUD 29

4 Tests d’adéquation de Loi


Test de Kolmogorov / Lilliefors

H0 : "Les réalisations de l'échantillon peuvent être considérées comme celle


d'une V.A. suivant la Loi FX dans PN "
Démarches

d i = F ( xi ) / H 0 − F ( xi )

1-

F ( xi ) / H 0 Fonction de répartition de la loi sous l'hypothèse H0

F ( xi )

Estimation de la fonction de répartition par les rang médians

2- Fixer un niveau 1-α

Si tous les di < Kα (Seuil à partir des tables)

Rien ne s'oppose à retenir H0

Si H0 : L ( X ) = N ( m ; σ )
Test de Lilliefors
d i = F ( xi ) / H 0 − F ( xi )

d i < Lα
Documents de travail J.MAHFOUD 30
4 Tests d’adéquation de Loi
Test de Kolmogorov / Lilliefors

Kolmogorov Lilliefors

Documents de travail J.MAHFOUD 31

4 Tests d’adéquation de Loi


Test de Kolmogorov / Lilliefors

Echant. 11
H0 N(m;σ)
xbar 17,86 13
m 18
sx 4,70 16
σ 5
sx' 5,08 18
20 n 7
21
α 0,8 0,9 0,95
26
L 0,247 0,276 0,3

i Xi F0.5 F di
1 11 0,0946 0,0808 0,0138

F0.5 estimation de la Fonction de répartition/rang médian pour un échantillon de taille 7 0,0946

L ( X ) = N (18 ; 5 ) ; Pr( X < 11) 


Table Modèle Normal
→ 0.0808

d1 = 0.0808 − 0.0946
Documents de travail J.MAHFOUD 32
4 Tests d’adéquation de Loi
H0 N(m;σ) n 7
Test de Kolmogorov / Lilliefors m 18 L 0,247
σ 5
i Xi F0.5 F di Fα/2 F1-α/2
Echant. 1 11 0,0946 0,0808 0,0138 -0,1662 0,3278
xbar 17,86
2 13 0,2297 0,1587 0,0711 -0,0883 0,4057
sx 4,70
3 16 0,3649 0,3446 0,0203 0,0976 0,5916
sx' 5,08
α 0,8 0,9 0,95
4 18 0,5000 0,5000 0,0000 0,2530 0,7470

L 0,247 0,276 0,3 5 20 0,6351 0,6554 0,0203 0,4084 0,9024


6 21 0,7703 0,7257 0,0445 0,4787 0,9727
7 26 0,9054 0,9452 0,0398 0,6982 1,1922

1,0000
F0.5
= 0.9452 - 0.247
F

0,7500 Fa/2
F1-a/2
FX(x)

0,5000

0,2500

0,0000
5 10 15 20 25 30
x

Documents de travail J.MAHFOUD 33

Vous aimerez peut-être aussi