Vous êtes sur la page 1sur 210

THESE

prsente
LECOLE SUPERIEURE DINGENIEURS DANNECY (ESIA)
UNIVERSITE DE SAVOIE
par
Emmanuel DUCLOS
pour obtenir le
DIPLME DE DOCTEUR DE LUNIVERSITE DE SAVOIE
spcialit :
Electronique - Electrotechnique - Automatique
Contribution la Matrise Statistique
des Procds
Cas des procds non normaux
Le 27 Novembre 1997 devant le Jury compos de :
Mr A. BARREAU Rapporteur Professeur lUniversit de Angers
Mr G. COLLIARD Examinateur Directeur de la socit ODS Europe
Mr A. COURTOIS Directeur de Thse Professeur lUniversit de Savoie
Mr G. MOREL Examinateur Professeur lUniversit de Nancy I
Mr M. PILLET Co-directeur de Thse Docteur-Agrg de lUniversit de Savoie
Mr G. SAPORTA Rapporteur Professeur au C.N.A.M. de Paris
A Joss
et mes amis des Aravis
Remerciements
Le travail prsent dans ce mmoire a t ralis au Laboratoire de Logiciels pour la Productique
dAnnecy (LLP/CESALP) dirig par Monsieur Alain HAURAT. Je tiens lui adresser mes
remerciements pour mavoir accueilli au sein de son laboratoire. Je remercie particulirement
Maurice PILLET pour le travail quil a effectu a mes ct ainsi que pour les rapports chaleureux
quil a su entretenir.
Je tiens remercier Alain COURTOIS Professeur lUniversit de Savoie pour les prcieux
conseils quil ma donn au cours de ce travail.
Je remercie vivement Monsieur Alain BARREAU, Professeur lInstitut des Sciences et
Techniques de lIngnieur dAngers, pour avoir accept de rapporter sur ce travail et de participer
au jury. Sa notorit dans le domaine de la Qualit mhonore particulirement.
Je suis trs reconnaissant Monsieur Gilbert SAPORTA, Professeur au Conservatoire National des
Arts et Mtiers de Paris, davoir accept dtre rapporteur de ce travail.
Je remercie Monsieur Grard MOREL, Professeur lUniversit de Nancy I, de me faire lhonneur
de participer au Jury.
Je remercie vivement Monsieur Guy COLLIARD, directeur dODS Europe, dont la motivation a
t dterminante pour llaboration de cette convention CIFRE.
Je remercie galement les entreprises qui mont permis de mettre en uvre et de tester les
mthodes prsentes dans ce mmoire : DAPTA, ID, SALOMON, ...
Je remercie Mohammed TABIZA, doctorant au LAMII, pour le temps quil ma consacr lors de
longues sances dinitiation la statistique, ainsi que Pascal ZAVAGNO pour son dvouement et
ses nombreux coups de main en informatique.
Je remercie enfin, tous les membres du LLP pour lambiance chaleureuse laquelle ils contribuent,
avec une mention particulire pour Rgis, Olivier, Isabelle et Gulin qui ont partag mon bureau.
Table des matires
Chapitre 1
Concepts et outils statistiques de la M.S.P.
Chapitre 2
La non normalit aborde par la Matrise Statistique des Procds
Chapitre 3
Mise en place dune carte de contrle pour les procds non normaux
Chapitre 4
Application industrielle de la carte L
Chapitre 5
Conclusion et Perspectives
Chapitre 1
Concepts et outils statistiques de la M.S.P.
1. La MSP, une ncessit conomique____________________________________________1
1.1 Lavnement de la M.S.P._______________________________________________________1
1.2 Classification des outils de la qualit______________________________________________2
2. Concepts de la M.S.P_______________________________________________________4
2.1 Notion de capabilit____________________________________________________________4
2.1.1 Introduction______________________________________________________________________4
2.1.2 Les indicateurs - Cp et Cpk__________________________________________________________5
2.1.3 Vers un indicateur plus synthtique - Le Cpm____________________________________________6
Notion de rendement_________________________________________________________________7
Le cas unilatral_____________________________________________________________________7
Les pertes non symtriques_____________________________________________________________9
2.2 Les cartes de contrle__________________________________________________________10
2.2.1 Les principes de base______________________________________________________________10
Dispersion instantane et dispersion globale______________________________________________10
Maintenir le procd sous contrle______________________________________________________11
2.2.2 Carte de type Shewhart____________________________________________________________11
Estimation par intervalle de confiance___________________________________________________12
Carte position______________________________________________________________________12
Carte de dispersion__________________________________________________________________14
2.2.3 Autres cartes de contrle___________________________________________________________15
Les cartes CUSUM & EWMA_________________________________________________________15
Cartes de contrle multidimensionnelles_________________________________________________16
Cartes petite srie___________________________________________________________________17
Cartes de pr-contrle________________________________________________________________21
2.2.4 Etude de performance des cartes de contrle____________________________________________22
3. Le choix dune mthode statistique___________________________________________24
3.1 Problmatique de la modlisation_______________________________________________24
3.1.1 Les modles paramtriques_________________________________________________________25
3.1.2 Modles non paramtriques_________________________________________________________25
Modle de localisation pour une observation______________________________________________25
Modle dchelle pour une observation__________________________________________________26
Modle de localisation chelle pour une observation________________________________________26
Modle de localisation chelle pour un chantillon_________________________________________26
3.1.3 Mthodes non paramtriques________________________________________________________26
3.1.4 Qualit des mthodes non paramtriques_______________________________________________27
3.2 Performances dun estimateur__________________________________________________27
3.2.1 Efficacit dun estimateur___________________________________________________________27
Estimation ponctuelle________________________________________________________________27
Lerreur quadratique moyenne_________________________________________________________28
Lefficacit relative__________________________________________________________________28
La borne de Frechet_________________________________________________________________29
Loptimalit_______________________________________________________________________29
3.2.2 Robustesse dun estimateur_________________________________________________________30
4. Orientation des travaux____________________________________________________31
4.1 Les principes de base de la M.S.P. et leurs limites__________________________________31
4.2 Orientation de nos travaux_____________________________________________________31
Chapitre 2
La non normalit aborde par la Matrise Statistique des Procds
1. Le mythe de la loi normale___________________________________________________1
1.1 Justification de la normalit_____________________________________________________1
1.2 Procds non normaux__________________________________________________________2
1.2.1 Introduction______________________________________________________________________2
1.2.2 Les procds multignrateurs________________________________________________________3
1.2.3 Les dfauts de forme_______________________________________________________________5
1.2.4 Critres de position_________________________________________________________________6
1.3 Rpercussions de la non normalit sur les mthodes de la M.S.P.______________________8
1.3.1 Incidence sur les indicateurs de capabilit_______________________________________________8
1.3.2 Dterminer les limites des cartes de contrle_____________________________________________9
1.3.3 Incidence sur le choix de lestimateur_________________________________________________11
2. La capabilit des procds non Normaux______________________________________13
2.1 Les indicateurs fonds sur des distributions thoriques_____________________________14
2.1.1 Les critres de forme______________________________________________________________14
2.1.2 La loi de Rayleigh________________________________________________________________15
2.1.3 La loi Log-normale________________________________________________________________16
2.1.4 Limite de ces mthodes____________________________________________________________16
2.2 Indicateurs de capabilit fonds sur des familles de distributions_____________________17
2.2.1 La famille des lois de Burr__________________________________________________________17
Identification de la loi________________________________________________________________18
Construction des indicateurs de capabilit________________________________________________18
Conclusion________________________________________________________________________19
2.2.2 La famille des lois de Pearson_______________________________________________________20
2.2.3 La famille des lois de Johnson_______________________________________________________21
Prsentation des courbes de Johnson____________________________________________________22
Choix de la famille de courbes_________________________________________________________22
Calcul de la dispersion et des indicateurs de capabilit.______________________________________23
2.2.4 Critique des mthodes_____________________________________________________________23
2.3 Approches non paramtriques__________________________________________________24
2.3.1 Mthodes bootstrap_______________________________________________________________24
La mthode de calcul________________________________________________________________25
Le Bootstrap standard ou Naf_________________________________________________________25
Bootstrap par les p-quantiles___________________________________________________________26
Bootstrap biais corrig par les p-quantiles.______________________________________________26
Rsultats__________________________________________________________________________27
3. Les cartes de contrle______________________________________________________28
3.1 Mthodes fondes sur une famille de lois__________________________________________28
3.1.1 Construction dune carte partir des lois de Burr________________________________________28
La distribution de BURR_____________________________________________________________29
Dtermination des paramtres de la loi de Burr____________________________________________30
Dveloppement de la carte de contrle non symtrique______________________________________30
Conclusion________________________________________________________________________31
3.2 Cas des populations stratifies__________________________________________________32
3.2.1 Mthodes d'chantillonnage_________________________________________________________32
Dfinition des strates________________________________________________________________32
Rpartition optimum de lchantillon entre les strates_______________________________________33
Estimation de la moyenne de la population_______________________________________________34
Variance de lestimateur de la moyenne__________________________________________________34
Exemple dapplication un procd mutignrateur________________________________________35
Aspect pratiques____________________________________________________________________36
3.2.2 Cartes de contrle pour les populations stratifies________________________________________36
Conclusion________________________________________________________________________38
3.3 Une approche non paramtrique________________________________________________39
3.3.1 Lestimateur de Hodges Lehmann____________________________________________________39
Prsentation de lestimateur de Hodges-Lehmann__________________________________________39
Les limites de contrle_______________________________________________________________40
Les performances de la carte de contrle de Hodges-Lehmann________________________________40
Comparaison entre la carte de Shewhart et la carte de Hodges-Lehmann________________________41
Critique des rsultats_________________________________________________________________42
3.3.2 Calcul des limites partir des p-quantiles empiriques dun chantillon ordonn_________________43
Analyse de la priode oprationnelle____________________________________________________44
Quelques restrictions sur la mthode :___________________________________________________45
4. Synthse_________________________________________________________________46
4.1 Les indicateurs de capabilit____________________________________________________46
4.1.1 Indicateurs de capabilit pour les procds non normaux__________________________________46
4.1.2 Rflexion sur les indicateurs_________________________________________________________46
Dispersion 6o_____________________________________________________________________46
Dispersion sur 99,73% de la population__________________________________________________47
Conclusion________________________________________________________________________48
4.2 Les cartes de contrle__________________________________________________________50
4.3 Conclusion___________________________________________________________________51
Chapitre 3
Mise en place dune carte de contrle pour les procds non normaux
1. Introduction______________________________________________________________1
2. Statistiques dordre et L-estimateurs___________________________________________3
2.1 Introduction aux statistiques dordre_____________________________________________3
2.1.1 Les statistiques dordre______________________________________________________________3
2.1.2 Lois de probabilit associes une statistique dordre______________________________________4
2.1.3 Moments des statistiques dordre______________________________________________________4
2.2 Les L-statistiques______________________________________________________________5
2.2.1 Loi asymptotique des L-statistiques____________________________________________________5
2.2.2 Robustesse des L-statistiques_________________________________________________________7
3. Proposition dun autre estimateur pour les cartes de contrle_______________________8
3.1 Choix de lestimateur___________________________________________________________8
3.2 Le L-estimateur des moindres carrs______________________________________________9
3.2.1 Prsentation______________________________________________________________________9
3.2.2 Estimation par les moindres carrs_____________________________________________________9
3.3 Cas particulier des distributions symtriques______________________________________11
3.3.1 Etude qualitative du L-estimateur_____________________________________________________12
Calcul du L-estimateur par la mthode de Lloyd___________________________________________12
Calcul du L-estimateur par la mthode de Bovik___________________________________________14
Variance asymptotique du milieu_______________________________________________________14
3.3.2 Etude de la P.OM.________________________________________________________________16
3.4 Gnralisation au cas non symtrique____________________________________________18
3.4.1 Choix du paramtre de localisation___________________________________________________18
Cas dune fonction perte symtrique____________________________________________________18
Cas dune fonction perte non symtrique_________________________________________________19
3.4.2 Choix du paramtre de dispersion____________________________________________________21
3.4.3 Exemple dapplication dun L-estimateur une loi non normale.____________________________21
Caractristiques de la population_______________________________________________________21
Etude de variance___________________________________________________________________22
Distribution des estimateurs___________________________________________________________23
4. Mise en oeuvre de la carte L________________________________________________24
4.1 Construction du L-estimateur___________________________________________________24
4.2 Dmarrage dune carte L_______________________________________________________25
4.2.1 Les procds volution lente_______________________________________________________25
4.2.2 Les procds volution rapide et les petites sries.______________________________________28
Les mthodes bootstrap______________________________________________________________28
Application un chantillon ordonn____________________________________________________28
Pr-requis lutilisation de la mthode bootstrap___________________________________________30
Exemple dapplication_______________________________________________________________30
4.3 Calcul des limites de contrle___________________________________________________32
4.3.1 Problmatique____________________________________________________________________32
4.3.2 Intervalle de confiance pour un paramtre de localisation__________________________________32
Intervalle de confiance pour un p-quantile________________________________________________33
Intervalle de confiance universel ____________________________________________________33
Limites traditionnelles des cartes de contrle______________________________________________34
4.3.3 Choix des limites de contrle________________________________________________________34
Tolrance aux valeurs extrmes________________________________________________________34
4.3.4 Intervalle de confiance pour le paramtre dchelle_______________________________________35
4.4 Incidence sur les rgles de pilotage_______________________________________________36
4.4.1 Procd sous contrle______________________________________________________________36
4.4.2 Procd hors contrle______________________________________________________________37
4.4.3 Tendance Suprieure ou Infrieure la cible____________________________________________37
4.4.4 Tendance Croissante ou Dcroissante_________________________________________________38
4.4.5 Point proche dune limite de contrle__________________________________________________39
4.4.6 Synthse des rgles de pilotage______________________________________________________39
4.5 Sensibilit de la carte L________________________________________________________40
4.5.1 Sensibilit un dcentrage__________________________________________________________40
Cas dune non normalit trs marque___________________________________________________40
Cas dune faible non normalit_________________________________________________________43
Remarque_________________________________________________________________________44
4.5.2 Sensibilit une dformation de la population___________________________________________44
Cadre de notre tude_________________________________________________________________44
Rsultats__________________________________________________________________________47
Conclusion________________________________________________________________________48
4.5.3 Le cas particulier des dfauts de forme_________________________________________________50
Choix des paramtres estimer________________________________________________________50
Variance du L-estimateur dans le cas des dfauts de forme___________________________________51
Conclusion________________________________________________________________________52
4.6 Extensions de la carte L________________________________________________________53
4.6.1 La carte CUSUM L________________________________________________________________53
Principe de la carte CUSUM-L_________________________________________________________53
Exemple dapplication_______________________________________________________________54
P.O.M. de la carte CUSUM-L_________________________________________________________55
Conclusion________________________________________________________________________56
5. Conclusions et perspectives_________________________________________________57
Une approche gnraliste_____________________________________________________________57
Avantages de la carte L______________________________________________________________57
Mise en uvre_____________________________________________________________________58
Les limites de la carte L______________________________________________________________58
Perspectives_______________________________________________________________________ 58
Chapitre 4
Application industrielle de la carte L
1. Pr-requis lapplication dune carte L________________________________________2
1.1 Les procds tudis____________________________________________________________2
1.2 La mthode dchantillonnage___________________________________________________3
1.2.1 Exemple_________________________________________________________________________4
1.3 Les besoins informatiques_______________________________________________________5
1.3.1 Ncessit dun outil informatis_______________________________________________________5
1.3.2 Prsentation de la maquette informatique________________________________________________6
2. Exemples dapplication______________________________________________________8
2.1 La plasturgie__________________________________________________________________8
2.1.1 Etude dune presse injecter 8 empreintes_______________________________________________9
2.1.2 Etude dune presse injecter 4 empreintes______________________________________________14
2.2 Lindustrie du dcolletage______________________________________________________19
2.2.1 Etude dun tour multibroches 6 broches________________________________________________19
3. Conclusion______________________________________________________________23
Introduction
La mondialisation de l'conomie suscite aujourd'hui une concurrence importante entre les
entreprises. La recherche de la qualit est devenue un point-cl de la comptition du fait de
l'importance de l'offre par rapport la demande. Ainsi, l'obtention de la qualit des services et des
produits passe le plus souvent par la mise en place dun systme dassurance qualit et par
l'utilisation des outils de la qualit tant au niveau de la conception que de la ralisation des produits.
La Matrise Statistique des Procds, qui s'inscrit dans une stratgie de prvention et dont lobjectif
est d'amliorer la qualit d'une production, a donc connu un fort dveloppement dans l'industrie
europenne ces dix dernires annes.
Cette utilisation intensive et la diversit des applications ont contribu mettre en vidence des cas
o les hypothses statistiques sur lesquelles reposent les outils de la M.S.P. ne sont pas valables.
Parmi ces cas, la non normalit de la distribution des observations est frquemment rencontre par
les industriels. Lobjectif de notre travail a t dans un premier temps dtudier lincidence de la
non normalit sur les performances des outils de la M.S.P. et la validit des solutions proposes.
Nous avons ensuite prsent une nouvelle approche pour la construction de cartes de contrle dans
le cas dune population non normale. La non normalit de la distribution des observations est selon
Shewhart significative d'un processus qui n'est pas "sous contrle". Cette non normalit peut
nanmoins tre acceptable pour un industriel et nous montrerons dans notre expos qu'il est
possible de tirer parti de la composante dterministe du signal pour amliorer l'efficacit des cartes
de contrle.
Aprs avoir prsent les concepts de la M.S.P, et certains de leurs dveloppements rcents, nous
rappellerons quelques notions importantes de la thorie de lestimation. Nous aborderons en effet
dans notre expos le problme des estimations s'appuyant sur un modle statistique non
paramtrique.
Nous tudierons ensuite les diffrents cas de non normalit rencontrs dans le cadre dapplications
industrielles et certaines des mthodes proposes pour estimer les indicateurs de capabilit. Nous
discuterons galement des performances de cartes de contrle ddies aux procds non normaux et
de lintrt pratique des mthodes employes.
Pour amliorer les performances des cartes de contrle dans le cas de procds non normaux, nous
proposerons lutilisation dun estimateur non paramtrique qui a des proprits intressantes en
terme de variance pour un large ensemble de lois. Nous mettrons en vidence les performances de
ces nouvelles cartes de contrle (la carte L) et prsenterons plusieurs mthodes pour sa mise en
uvre dans un contexte industriel. Ces tudes seront valides par des exemples dapplication en
milieu industriel.
Chapitre I
Chapitre I
Concepts et outils statistiques de la MSP
La MSP, une ncessit conomique
Cest en 1929 que Shewhart a prsent sa clbre Control Chart , ouvrant ainsi la voie une
nouvelle discipline quest la M.S.P. Tout dabord oublie, ce nest que dans les annes 60 que
Deming a su insuffler un regain dintrt cette technique.
En effet, les japonais avaient dj compris lenjeu que reprsentait la qualit au lendemain de la
deuxime guerre mondiale. Le passage dune conomie de production, durant les 30 glorieuses,
une conomie de march aprs la crise de 73 poussa lindustrie europenne subir de fortes
mutations et cest seulement dans les annes 80 que la qualit simposa comme une vidence en
Europe.
La M.S.P. sous ses diffrentes formes constitue aujourdhui le fer de lance dune stratgie de
prvention. La M.S.P. nest pas elle seule synonyme de qualit, on la conjugue avec dautres
outils tels que lAMDEC, les plans dexprience, les techniques de rgression, le QFD ainsi que les
7 outils de la qualit pour obtenir un ensemble cohrent, capable de soutenir le systme qualit.
Lavnement de la M.S.P.
Lindustrie japonaise utilise de faon intensive les outils statistiques depuis plus dune quarantaine
dannes. Lvolution des mthodes de production et du niveau de qualit souhait est lorigine de
la prise de conscience des bnfices importants quil tait possible de raliser grce aux statistiques.
Au cours de lhistoire, le contrle qualit sest dabord orient sur le produit fini. Ce contrle tait
ralis soit par un contrle 100% soit par un contrle statistique alors quaucune de ces deux
mthodes ne permet dobtenir 100% de produits bons. Les plans de contrle ncessitent, en effet,
des prlvements importants pour ne garantir quun niveau assez mdiocre de produits non
conformes, alors que les niveaux de qualit requis sont souvent de lordre de quelques pices par
millions (ppm).
Dautre part, les cadences de production ayant considrablement augmentes, il devient impossible
de procder du contrle 100%. Ce type de contrle ne donne dailleurs que des rsultats
mdiocres lorsquil est ralis par lhomme, du fait de son caractre rptitif.
Enfin, le contrle final, quil soit statistique ou 100%, est trs critiquable puisquil mobilise du
personnel qui napporte aucune valeur ajoute au produit. Il garantit plus ou moins un niveau de
qualit pour le client mais nempche pas la fabrication de produits non conformes qui finissent par
savrer trs coteux pour les entreprises.
Ces constats ont donc motiv les entreprises voluer vers un contrle, plus ractif, en amont du
produit fini. Il sagit de lauto-contrle.
Classification des outils de la qualit
Pour aborder la dmarche de la qualit totale, celle-ci doit sappliquer au niveau le plus lev de
lentreprise. Cest par lapplication simultane des outils et mthodes de la qualit que les
industriels performants arrivent placer rapidement sur le march des produits comptitifs.
La M.S.P. que nous aborderons en dtail dans ce mmoire nest quun maillon de la chane de la
qualit, que lon applique tout au long du processus de cration et de fabrication dun produit.
Le tableau (Figure 1 ) prsente le degr dutilit de chacun de ces outils pour les diffrentes tapes
de dfinition du processus de fabrication et de conception du produit. On remarque en particulier
que la M.S.P. est llment terminal de cette longue chane de spcifications et quelle est le seul
outil capable dassurer la qualit du produit au niveau de loutil de production.
Phases de
dveloppement
PLAN
DEXPERIENCES
QFD AMDEC
PRODUIT
AMDEC
PROCEDE
MSP
Dfinition
du produit
L J
Dfinition des
caractristiques
J J
Validation
du produit
J J
Dfinition du
processus
J L
Validation du
processus
J J K
Dfinition des
spcifications
J J K
Suivi et pilotage en
production
J
J Utilisation Majeure L Utilisation Mineure (daprs Pil 93
1
)
Figure 1
1
PILLET M. Contribution la Matrise Statistique des Procds - Cas particulier des petites sries - Thse en
Sciences de Lingnieur - Univ. Savoie -1993
Concepts de la M.S.P
La naissance de la M.S.P. remonte la fin des annes 20 par les clbres travaux de Shewhart
[She 32]
2
o ce dernier propose de dceler les causes de non qualit dun produit partir de tests
statistiques sous forme graphique ; la carte de contrle est ne. Dans les dcennies qui ont suivi, la
M.S.P. sest enrichie doutils modernes rpondant de nouvelles attentes des industriels. Parmi les
applications de la M.S.P, nous nous limiterons ltude des outils ddis aux critres mesurables.
Ces outils, aussi diffrents soient ils, sappuient sur deux concepts essentiels de la M.S.P :
- Lanalyse de capabilit
- Le pilotage par carte de contrle
Bien que les concepts de capabilit et de carte de contrle naient pas t introduits en mme temps,
ils sont trs troitement lis.
Une tude de capabilit permet de dfinir si le procd de fabrication est apte fournir un produit
avec le niveau de qualit requis. Les indices de capabilit consistent en effet comparer la qualit
dune production sur une priode donne, par rapport un objectif donn.
Tandis que les cartes de contrle permettent de piloter un procd, afin de maintenir et damliorer
sa capabilit.
Notion de capabilit
Introduction
On dfinit la capabilit dun moyen de production comme tant une quantification de la
performance relle du procd par rapport la
performance souhaite. La traduction en langage
mathmatique de cette dfinition donne lieu,
encore lheure actuelle, beaucoup de
discussions. Deux questions se posent en effet,
savoir :
- Quelle est la traduction de la performance
souhaite ?
- Comment mesurer la performance relle ?
Si tout le monde est peu prs daccord pour
prendre lintervalle de tolrance comme
rfrentiel de la performance, le calcul de la
performance relle suscite encore quelques
interrogations lorsque lon sintresse aux
procds non normaux.
2
SHEWHART Economic Control of Quality of Manufactured Products -Van Nostrand Co. Inc Princeton - 1932
Notion de capabilit selon Serre.
Ce problme sera largement abord dans le chapitre suivant, cest pourquoi nous ne nous y
attarderons pas plus longtemps.
Deux gnrations dindicateurs de capabilit ont ainsi vu le jour :
- Les indicateurs de premire gnration qui sappuient sur un calcul de la dispersion des mesures.
- Les indicateurs de deuxime gnration, qui se basent sur la fonction perte introduite par
Taguchi.
Les indicateurs - Cp et Cpk
Il nest plus besoin de vanter les mrites des indicateurs de capabilit Cp et Cpk. Ils sont dj
largement utiliss dans lindustrie pour dfinir la qualit dun produit livr au client.
Rappelons les formules de ces indicateurs (Eq 0). On note et o la moyenne et la dispersion de la
population, IT est lintervalle de tolrance, TS et TI sont respectivement les Tolrances Suprieure
et Infrieure.
Cp=
IT
6 s
Cpk=Min
(
TSm, mTI
3 s
)
Eq 0
Ces indicateurs de capabilit sont indissociables si lon souhaite formaliser correctement le niveau
de qualit dune production. Cependant de nombreuses relations client fournisseur sappuient
uniquement sur le Cpk, pour la simple raison que cet indicateur intgre la fois une notion de
centrage et de dispersion.
On peut montrer au travers dun exemple quun Cpk seul, ne permet pas de rendre compte de la
qualit dun produit livr (Figure 2).
8 o
6 o
16 o
6 o
4 o
TS TS TI TI
Figure 2
On constate dans ces deux cas que le Cpk est de 1,33 alors que la qualit de ces produits est
fondamentalement diffrente. Dans le 1
er
cas le Cp est de 1,33 alors quil est de 2,67 dans le second
cas, ce qui peut conduire la conclusion que la production 2 est de meilleure qualit. Or nous
verrons dans le paragraphe suivant que cest exactement linverse.
Lutilisation du Cp et du Cpk ne permet donc pas une interprtation aise de la qualit dune
production. Il est encore plus difficile de comparer deux productions lorsque leurs Cp et Cpk sont
diffrents.
Le besoin dun indicateur de capabilit plus synthtique se fait donc ressentir.
Vers un indicateur plus synthtique - Le Cpm
Le Cpm a t introduit par Hsiang T.C. et Taguchi G. [Hsi 85]
3
bien aprs le Cp et le Cpk.
Cet indicateur a la particularit de prendre en compte la fois la dispersion et le centrage de la
production. Son avantage est donc de fournir une indication prcise sur la qualit de la production
au travers dune seule valeur.
Le principe du Cpm repose sur la considration suivante :
Le principal critre utilis pour juger si un produit est de qualit ou ne lest pas, est de vrifier si les
critres qui le caractrisent sont conformes aux spcifications. En tout tat de cause, un produit qui
est juste lextrieur des tolrances sera rejet alors quun produit qui est juste lintrieur de ces
tolrances est jug satisfaisant alors que la qualit intrinsque de ces deux produits est peu
diffrente (Figure 3).
IT
Produit 1 Produit 2
C
ib
le
Figure 3
Taguchi considre au contraire que tout cart dun critre par rapport la valeur cible est
dommageable pour la qualit du produit. Il propose donc dvaluer la non qualit dune
production en calculant un cart quadratique moyen par rapport la cible, cette procdure est plus
connue sous le nom de fonction perte de Taguchi .
La perte engendre par une valeur individuelle est donc value par
L=K ( X Cible)
2
.
Dans le cas dun chantillon de moyenne et dcart type o la perte moyenne par pice est donne
par la relation (Eq 0) :
L=K ( s
2
+( mCible)
2
)
Eq 0
3
HSIANG T. C. TAGUCHI G. A tutorial on Quality Control and assurance - The Taguchi Methods
ASA - Annual Meeting Las Vegas - 1985
Le Cpm est alors dfini par (Eq 0) :
Cpm=
IT
6
.
s
2
+( mCible)
2
Eq 0
Si on se reporte lexemple nonc au , on constate que le Cpm pnalise normment le
dcentrage dun procd puisque dans le premier cas Cpm= 1,33 alors que dans le second cas,
Cpm= 0,64. Cette diffrence sexplique par un mauvais rendement de rglage dans le cas N2 ou le
Cp est trs bon mais le centrage du procd laisse dsirer.
Notion de rendement
Une particularit intressante du Cpm est dintgrer une notion de rendement de rglage du
procd. En effet, on constate que le Cpm est gal au Cp lorsque le procd est parfaitement rgl :
cest--dire lorsque Cp = Cpk. Plus le rglage se dtriore (le Cpk scarte du Cp), plus le Cpm
tend vers 0.
0
0.5
1
1.5
2
2.5
0 1 2 3 4 5 6
k
Cp
Cpk
Cpm
Ainsi le Cpm savre beaucoup plus sensible au dcentrage que le Cpk. On trouve par exemple un
Cpm de 1.33 pour un dcentrage de k=1.11o alors que Cpk=1.33 pour un dcentrage de k=2o.
Le cas unilatral
Du fait de sa limitation aux critres bilatraux le Cpm tait encore considr par certains
utilisateurs comme un outil mineur de la M.S.P. Une extension au cas unilatral propose par M.
Pillet [Pil 96b]
4
[Pil 97b]
5
largit le cadre dapplication du Cpm et le rend, ainsi, au moins aussi
attrayant que le Cp et le Cpk.
4
PILLET M. DUCLOS E. COURTOIS A. Gnralisation de lindicateur de capabilit Cpm -
Cas des tolrances unilatrales - Contrle Industriel et Qualit - N196 - Fvrier 96
5
PILLET M. ROCHON S. DUCLOS E. Generalization of capability index Cpm. Case of unilateral tolerances
Quality engineering, accept, USA
Nous avons vu prcdemment que le Cpm intgrait une notion de rendement par rapport une
situation o le procd est parfaitement centr. Dans le cas unilatral, il nest pas possible de
centrer le procd, cest pourquoi nous allons dfinir une situation de rfrence (Figure 4) telle
que :
- la moyenne soit situe o de 0 ;
- La moyenne soit situe 4o de la limite suprieure ;
- Le Cpm de rfrence soit de 1,33.
IT
4 o o
X
P
e
r
te
Figure 4
La valeur dtermine le niveau de qualit souhait, cest pourquoi il doit tre le fruit dun
consensus entre le client et le fournisseur. Elle sera fixe entre 3 et 5.
Voyons comment rcrire lquation du Cpm (Eq 0) :
Cpm=
IT
A.s
2
+m
2
=
( 4+)s
A
.
s
2
+( s)
2
=1, 33d ' o A=
( 4+)
1, 33.1+
2
Eq 0
Ainsi on peut donner les diffrentes valeurs de A en fonction de (Figure 5) :

3 4 5
A 1.66 1.46 1.33
Figure 5
La formule du Cpm est indpendante de la distribution de la population, ainsi son application est
particulirement aise dans le cas des dfauts de forme.
Les pertes non symtriques
La philosophie du Cpm est trs diffrente de celle des indicateurs Cp et Cpk. Alors que le Cp et le
Cpk sont trs lis la notion de pourcentages hors tolrance, le Cpm traduit plus la qualit globale
des produits.
Une des subtilits du Cpm est dailleurs de pouvoir considrer quun cart positif par rapport la
cible peut engendrer des pertes diffrentes dun cart ngatif [Tag 89]
6
. Ce cas de figure est
rencontr frquemment dans lindustrie lorsque le dpassement dune tolrance provoque dans un
cas une opration de retouche sur le produit (faible cot), et dans lautre cas un rebut (cot lev).
TS TI
K
2
K
1
x
2
x
1
C
i
b
l
e
Figure 6
Dans ce cas, on dfinit la perte moyenne par la relation (Eq 0) :

L=
1
N

|
K
1

'
( xCible)
2
+K
2

''
( xCible)
2

Eq 0
avec : K
1
le coefficient de la fonction perte pour tout x<Cible
K
2
le coefficient de la fonction perte pour tout x>Cible
Dans ce cas, lintuition nous dit que la meilleure politique nest pas forcment de centrer la
production sur la cible pour minimiser la perte (Figure 6). Nous aborderons ce sujet plus en dtail
dans le chapitre 3.
Rappelons enfin que les indicateurs de capabilits sont estims en remplaant et o par des
estimations (

X et S), do une incertitudes qui se traduit par un intervalle de confiance, trop peu
souvent utilis. Nous verrons au chapitre 2 2.3 une utilisation des intervalles de confiance sur les
indicateurs de capabilit.
6
TAGUCHI G. ELSAYED A. HSIANG T. C. Quality engineering in production systems - Mc Graw-Hill 1989
Les cartes de contrle
Les principes de base
Les cartes de contrle sont des outils indispensables pour raliser un pilotage rationnel du procd
de fabrication. Une application rigoureuse de cette mthode permet damliorer de manire
significative la capabilit du procd pour deux raisons :
- Lemploi de critres de dcisions statistiques permet de rduire les erreurs lies un rglage
inopportun ou une absence de rglage. Il en rsulte une augmentation du rendement de
stabilit.
- De plus, lapplication dune politique consistant viser une valeur cible permet daugmenter le
rendement de rglage
Dispersion instantane et dispersion globale
Lorsque nous avons abord la notion de capabilit, nous avons bien sr parl de la dispersion du
procd. Cette variabilit provient de lensemble du procd de production que lon dcompose
gnralement en cinq sources lmentaires de dispersion (les 5M) et, par consquent, cinq causes
fondamentales de la non qualit : Machine, Main duvre, Matire, Mthodes et Milieu.
Lobjectif de la qualit tant de rduire linfluence des causes de dispersion, on ciblera tout
naturellement notre action sur les 5M du procd. Or, il est souvent difficile dagir sur la dispersion
de la machine, moins dinvestissements importants. Cette dispersion rsiduelle, que lon qualifie
aussi de dispersion naturelle , dtermine donc la capabilit maximale que lon puisse atteindre :
cest la capabilit machine.
On distinguera donc deux types de dispersion : la dispersion instantane cause par la machine et
dans une moindre mesure les autres M , et la dispersion globale qui est une rsultante des
variations causes par les 5M sur la priode de production.
Dispersion
instantane
Temps
Dispersion
globale
Dispersion
instantane
Temps
Dispersion
globale
C
o
t
e
C
o
t
e
Figure 7
Pour rduire la dispersion globale du procd et, donc, pour que la capabilit procd tende vers la
capabilit machine, il est ncessaire de limiter les variations de consigne de la machine en la
pilotant. Le problme qui se pose alors est de distinguer les carts du procd qui sont naturels, de
ceux qui doivent entraner un rglage.
Maintenir le procd sous contrle
En analysant finement la dispersion dun procd, on peut extraire deux causes essentielles de
dispersion. Il sagit des causes communes, qui sont lies des phnomnes alatoires, et des causes
spciales qui sont des causes de dispersion identifiables.
Contrairement aux causes communes, les causes spciales ncessitent une intervention sur le
procd.
Causes
Spciales
Rglage 1 Rglage 2
Causes Communes
Les cartes de contrle ont t dveloppes dans le but de dtecter lapparition de causes spciales et
de les dissocier des causes communes qui ne ncessitent pas dintervention sur le procd. Pour
cela on ralise deux tests statistiques :
- Le premier pour sassurer que la machine nest pas drgle,
- Le second pour vrifier que la dispersion naturelle na pas chang.
Carte de type Shewhart
La carte de contrle propose par Shewhart est constitues dun test par intervalle de confiance,
pour vrifier la conformit dun paramtre du procd une valeur thorique et une estimation
ponctuelle qui permet de dterminer le rglage effectuer si la valeur du paramtre estim a
volu.
La carte de Shewhart, se compose de deux graphiques : une carte de position et une carte de
dispersion permettant respectivement de reprsenter lvolution de la position et de la dispersion de
la machine (Figure 8).
Date
Heure
X1
X2
X3
X4
X5
Moyenne
Ecart-type
X
S
Figure 8
Intervalle de confiance
On note une estimation ponctuelle dun paramtre
0
dune loi F

(X).
Pour raliser un test par intervalle de confiance ou test dhypothse sur un paramtre dun procd
on considre deux cas :
- On suppose que lestimation du paramtre du procd est gale une valeur thorique que lon
spcifie (la cible pour une carte de contrle). Cette hypothse est appele hypothse nulle H
0
.
=
0
- Lautre alternative note H
1
est valide lorsque lestimation est diffrente de la valeur
thorique.
=
0
Deux types derreurs peuvent tre commises lors dun test dhypothse :
- On peut tout dabord rejeter lhypothse nulle H
0
alors quelle est vraie. La probabilit de faire
cette erreur (type I) est aussi appele risque o ou risque fournisseur.
- On peut galement accepter lhypothse nulle H
0
alors quelle est fausse. La probabilit de faire
cette erreur (type II) est aussi appele risque | ou risque client.
Carte position
Pour construire la carte de position, on suppose quen labsence de causes spciales, la population
suit une loi normale.
Dans le cas de la carte de Shewhart, nous considrons que lcart type o de la population est connu.
On en dduit que lcart type de la moyenne dun chantillon de n observations est : s/ .n .
Ayant calcul la moyenne dun chantillon de n observations, nous cherchons dterminer si
lcart de cette moyenne par rapport la cible nest pas suprieur la dispersion naturelle de la
moyenne. Si lcart est suprieur un cart maximal admis pour un niveau de confiance donn
(dispersion naturelle de la moyenne), on conclut que la population nest pas centre sur la cible.
Dispersion naturelle de la
moyenne
o
o n
P
opulation
C
ib
le
Risque
o /2
L
IC
L
S
C
Figure 9
Pour dterminer les limites de contrle de la carte qui, comme on peut le constater sur la Figure 9,
correspondent la dispersion naturelle de la moyenne, on se fixe un risque o.
On note u une variable alatoire distribue selon une loi normale rduite :
u=
MoyenneCible
s/ .n
La table de la loi normale rduite fournit la probabilit que les ralisations dune variable alatoire
X distribue selon la loi normale rduite soit suprieure la valeur u.
En consultant cette table, on note que pour u=3, le risque o=0,0027. Si ce risque nous apparat
satisfaisant, on place les limites de contrle selon la relation (Eq 0).
LSC=Cible+3
s
.n
LIC=Cible3
s
.n
Eq 0
Calcul de la dispersion
Le calcul des limites de contrle de la carte de position suppose que lcart type des observations
soit connu. Cela nest gnralement pas le cas, cest pourquoi il est ncessaire de lestimer.
Pendant la priode de rfrence, o le procd est suppos rgl, on procde un chantillonnage
intervalle rgulier de k sous-groupes, dont leffectif nest pas forcment constant.
Lestimation S de lcart-type o est alors donne par la relation (Eq 0) :
S=
.

i=1
k

i
S
i
2

i=1
k

i
avec v
i
=n
i
-1 et
S
i
2
=

j=1
n
(
x
ij

x
i
)
2
n1
Eq 0
Carte de dispersion
Une carte de dispersion est galement utilise pour dtecter loccurrence de causes spciales dont
les effets se traduiraient par une modification de la dispersion instantane du procd.
De plus, le test prcdent de comparaison des moyennes, nest valide que dans lhypothse o
lcart-type o de la population est connu et constant. Il suffit donc que la carte de dispersion soit
sous contrle pour valider cette hypothse.
La carte de dispersion se base sur un test de comparaison de la variance de lchantillon par rapport
la variance de la population. Pour cela on calcule ltendue ou lcart type de lchantillon que
lon compare des limites de contrle.
Considrons la variable V =( n1 )
S
2
s
2
distribue selon une loi du
c
2
.
Nous voulons savoir, en admettant un risque o, si lcart type de lchantillon appartient la
population dcart-type o. Les limites du test sont alors dtermines en fonction du risque o choisi
par lingalit :
c
/ 2
2
V c
1/ 2
2
do
.
c
/ 2
2
( n1 )
sS
.
c
1/ 2
2
( n1 )
s
Eq 0
Une autre approche, beaucoup plus largement applique, consiste prendre les limites 3 cart-
types de S, de manire analogue la moyenne.
Lcart type de S est donn par la relation
s
.
1c
4
2 o c
4
est un coefficient correcteur du biais de
lcart-type empirique moyen par rapport lcart-type. En effet, le rapport

S / c
4
donne un
estimation sans biais de o.
Dans ce cas on obtient les limites de contrle (Eq 0) :
LSC=c
4
s+3 s
.
1c
4
2
LIC=c
4
s3 s
.
1c
4
2
Eq 0
Autres cartes de contrle
La carte de Shewhart est un outil incontournable de la M.S.P, mais il existe bien videmment
dautres cartes de contrle. Nous prsenterons succinctement les principes de celles qui, selon nous,
ont contribu le plus lvolution de la M.S.P.
Les cartes CUSUM & EWMA
Un des principaux inconvnients des cartes de type Shewhart est de ne baser son test que sur les
dernires informations recueillies. Elle ignore ainsi les informations relatives aux tendances du
procd contenues dans les dernires estimations. La carte de Shewhart savre donc peu
performante pour la dtection de faibles dcentrages.
Les cartes CUSUM (Cumulative Sum) et EWMA (Exponentially Weighted Moving Averages)
constituent une alternative intressante la carte Shewhart puisquelles ont la particularit de
dtecter les trs faibles drives du procd.
Le principe de la carte CUSUM est de sommer les carts entre les estimations de la position du
procd et la cible. Lorsque le cumul des carts positifs ou le cumul des carts ngatifs dpasse une
certaine valeur, on conclut un dcentrage du procd (Eq 0). Selon la sensibilit de la carte
souhaite, les limites de contrle H varient entre 4 et 5.
Afin dliminer les variations rsiduelles imputables aux causes communes, qui peuvent tre
lorigine de fausses alarmes, on applique un filtre K dont la valeur est souvent dun demi cart
type.
S
H
i
=Max
|
0,

X
i
( Cible+K )S
H
i1

S
L
i
=Max
|
0, ( CibleK )

X
i
+S
L
i1

Eq 0
Au mme titre que la carte CUSUM, la carte EWMA est particulirement adapte la dtection de
faibles drives.
La statistique M reporte sur la carte de contrle se calcule par la relation (Eq 0).
M
i
=

X
i
+( 1) M
i1
\]0;1\[} {}
i
Eq 0
La constante dtermine le poids que lon souhaite affecter aux dernires mesures. Plus cette
valeur est grande, plus la carte est sensible aux drives subites. En contrepartie, elle dtecte moins
bien les petits carts par rapport la cible.
Les limites de contrle de la carte EWMA se construisent 3 cart-types de la variable M.
s
M
=s
.
| 1( 1)
2i

n( 2)
dou les limites
LSC
M
i
=Cible+3 s
.
| 1( 1)
2i

n( 2)
LIC
M
i
=Cible3 s
.
| 1( 1)
2i

n( 2)
Cartes de contrle multidimensionnelles
Ces cartes de contrle sadressent aux procds multivaris dont plusieurs caractristiques sont
interdpendantes [Hot 47]
7
[Jau 97]
8
. Dans ce cadre, si plusieurs paramtres doivent tre contrls
simultanment, une pratique lmentaire veut que lon construise une carte de contrle pour chacun
des critres tudis. Ce faisant, on carte toute ventualit de corrlation entre les variables.
Supposons que lon suive indpendamment deux caractristiques X
1
et X
2
. Lutilisation simultane
de deux cartes de Shewhart conduit une rgion de contrle rectangulaire (Figure 10).
La probabilit que lune ou lautre des caractristiques sorte des limites de contrle est p= 0.27%.
En revanche, la probabilit jointe que les deux caractristiques soient hors contrle est p=0.0027
2
,
ce qui est excessivement faible. La reprsentation sous forme dune carte de contrle
bidimentionnelle est une zone sous contrle rectangulaire.
Posons maintenant le problme sous forme vectorielle en considrant la variable X distribue selon
une loi normale bidimensionnelle N(
0
,E
0
) (Eq 0).
X =
|
X
1
X
2

m
0
=
|
m
01
m
02

S
0
=
|
s
01
2
s
012
s
012
s
02
2

Eq 0
Dun point de vue statistique, la construction dune carte de contrle pour deux variables se
rapporte un test bivari avec les hypothses H
0
: =
0
et H
1
: =
0
Pour un chantillon

X
n
le test n
(

X m
0
)
t
S
0
(

X m
0
)
>c
2,
2
conduit une rgion critique en forme
dellipse. La rgion de validit du test est alors reprsent par la surface de lellipse tandis que la
zone de rejet est lextrieur.
7
HOTELLING H. Multivariable Quality Control - Techniques of statistical analysis
Mc Graw-Hill - New York - 1947
8
JAUPI L. SAPORTA G. Cartes de contrle pour la variabilit des procds multidimensionnels
Congrs Qualit et Sret de fonctionnement - Mars 97 - Angers
Zone de rejet
du test
X
2
X
1
LSC X
1
LIC X
1
L
S
C
X
2
L
IC
X
2
Les variables sont corrles
Z
one d'acceptation
du test
A
B
Zone
d'acceptation
du test
Zone de rejet
du test
X
2
X
1
LSC X
1
LIC X
1
L
S
C
X
2
L
IC
X
2
Les variables sont indpendantes
Figure 10
Si lon compare les zones dacceptation pour le contrle univari (rectangle) et multivari (ellipse),
on voit apparatre deux zones A et B o les conclusions des tests sont diffrentes.
- La Zone A correspond la non dtection dun tat hors contrle par la mthode univarie alors
que le test multivari conclue que le procd est hors contrle.
- La Zone B correspond une fausse alerte de la part de la mthode univarie puisque le test
multivari considre que le procd est sous contrle.
La taille des Zones A et B dpend essentiellement de la corrlation entre les variables X
1
et X
2
.
Nanmoins, ces zones existent toujours, ce qui justifie lemploi dune mthode multivarie.
Cartes petite srie
Les apports de la MSP dans le domaine de la production en grandes sries ne sont plus dmontrer.
Le formalisme et lefficacit de la dmarche MSP ont t largement plbiscits par les industriels
qui ont su lappliquer avec rigueur. Ces mthodes semblent cependant limites aux productions de
type grandes et moyennes sries, alors quune grande partie de la production industrielle repose
aujourdhui sur une organisation de type petites sries . La mise en place des concepts de Juste-
-Temps, va dailleurs dans le sens dune diminution de la taille des lots, de mme que la
diversification des produits qui oblige les industriels rduire la taille de leur cycle de production.
Cette volution, semble irrversible, cest pourquoi de nouveaux concepts ont t dvelopps pour
appliquer la M.S.P. aux productions en petites sries
La principale difficult rencontre lorsquon tudie des productions en petite srie est de les classer
par catgories. Les petites sries connaissent en effet une grande diversit, de sorte que chacune
delles semble un cas particulier. Nos procds sont trop particuliers pour appliquer la M.S.P.
entend-on souvent dans les ateliers ! Ce raisonnement conduit le plus souvent une approche
artisanale, trs subjective, qui ncessite une exprience importante de la part des oprateurs pour
mener bien le pilotage du procd.
Nous retiendrons deux approches fondamentalement diffrentes pour le traitement des petites
sries.
- La premire dentre elles, consiste rechercher un effet de srie dans des productions rptitives
de courte dure. Les observations recueillies pour des critres diffrents ou des oprations
diffrentes peuvent tre regroupes sur une mme carte de contrle de type grande srie.
- Une autre philosophie est danticiper au maximum les prises de dcision, mme pour des sries
trs courtes. Il sagit donc dexploiter au maximum les donnes rcoltes pour piloter le procd
Lobjectif dune carte de type effet de srie est de pouvoir suivre lvolution dun procd qui
ralise un travail rptitif en petites sries. Dans le cas de grandes sries, on utilise autant de cartes
de contrle que de produits ou de sries lances. Ceci est bien videmment inapplicable dans le cas
de petites sries puisque les cartes de contrle obtenues ne comporteraient pas plus de deux ou trois
points chacune. Loriginalit de cette carte rside donc dans lapplication dun changement de
variable, de manire pouvoir reporter sur la mme carte (Figure 11) les points issus doprations
affectant des produits diffrents (cibles et dispersions diffrentes).
Si on considre des oprations A, B et C avec des cibles et des dispersions diffrentes, on reportera
sur la carte, non pas les mesures

X mais une variable rduite du type (Eq 0). [Hil 69]


9
[Koo 91]
10
[Whe 91]
11

X Cible
A
s
A
/ .n
Eq 0
9
HILLER F. S. Xb and R chart Control Limits based on a small number of subgroups -
Journal of Quality Technology - pp17-26 - 1969
10
KOONS G. F. SPC : Use in low volume manufacturing environment - Statistical Process Control in Manufacturing
- Quality and reliability - ASQC Quality Press - 1991
11
WHEELER D. J. Short Run S.P.C. - SPC Press - 1991
Carte effet de srie
Date 3/09/97 3/09/97 5/09/97 5/09/97 6/09/97
Heure 8:25 11:56 9:32 17:15 18:41
Rfrence A B B A C
n 5 4 5 5 6
X1 12.21 15.10 15.11 12.02 10.51
X2 12.01 15.02 15.05 12.05 10.52
X3 11.98 15.03 15.02 12.03 10.55
X4 11.99 14.99 15.01 12.06 10.58
X5 12.05 15.03 12.05 10.56
X6 10.57
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
1 2 3 4 5 6
Figure 11
La carte petite srie [Pil 92]
12
[Pil 96a]
13
, comme son nom lindique, est particulirement adapte
aux sries trs courtes et aux dmarrages de sries. Son objectif est de permettre le pilotage du
procd ds les premires pices. Elle sappuie sur la technique de pilotage traditionnelle des cartes
de type Shewhart.
La M.S.P. prconise en gnral de travailler partir dchantillons pour amliorer la prcision des
mthodes statistiques. Mais pourquoi attendre lacquisition dune n
me
mesure pour savoir si le
procd est dcentr ? Le principe de la carte petite srie consiste donc dcomposer un chantillon
afin de placer un point sur la carte chaque nouvelle mesure (Figure 12). Pour tenir compte de
lenrichissement de linformation chaque nouvelle mesure, les limites de contrle se resserrent
(Eq 0).
LC=Cible!3 s/ .n
Eq 0
12
PILLET M. Application du SPC aux Petites Sries
Revue contrle industriel et qualit - N174 - pp58-61 - 1992
13
PILLET M. A specific SPC chart for Small-Batch control Quality Engineering - 8(4) - pp 581-586 - 1996
Cette carte sera donc trs apprcie pour des sries de moins de 10 pices.
Elle peut galement servir lancer une grande srie, en la collant une carte de Shewhart, afin
de vrifier si le procd est sous contrle ds les premires mesures.
Carte Petite Srie
Date 3/09/97 4/09/97 4/09/97 5/09/97 6/09/97
Heure 8:10 11:05 15:12 10:35 9:49
X1 0
X2 -1
X3 -1
X4 +3
X5 1
Total 0 -1 -2 +1 +2

X
0 -0.5 -0.66 +0.25 +0.4
R 1 1 4 4
-4
-3
-2
-1
0
1
2
3
4
1 2 3 4 5
LSC
Xb
LIC
Cible
0
2
4
6
1 2 3 4 5
LSC
R
Cible
Figure 12
Outre le pilotage de petites sries, cette mthode est particulirement adapte au dmarrage de
grandes sries.
Cartes de pr-contrle
Certaines entreprises qui critiquent la M.S.P. pour la lourdeur des calculs et de sa mthodologie,
substituent les cartes de contrle par des cartes de pr-contrle [Bho 91]
14
. Mme si ces cartes ne
constituent pas rellement une avance pour la M.S.P, elles ont la particularit dtre de plus en
plus utilises dans lindustrie.
Lobjectif des cartes de pr-contrle est de dtecter des drives du procd qui peuvent entraner
une production de pices non conformes. Cette mthode a lavantage de ne ncessiter aucune
construction graphique et ne demande que le prlvement de 2 chantillons pour prendre une
dcision.
Une carte de pr-contrle (Eq 0) est constitue de 3 zones. La moiti centrale de la zone de
spcification, dlimite par les limites de pr-contrle, constitue la zone verte tandis que les deux
autres quarts de la spcification constituent la zone jaune. A lextrieur des tolrances, on trouve la
zone rouge.
Cible
Limite suprieure de pr-contrle
Limite suprieure de spcification
ZONE VERTE
ZONE JAUNE
ZONEROUGE
IT/2
Figure 13
Pour dterminer si le procd est capable un instant donn, on prlve cinq pices conscutives.
Si les cinq pices sont dans la zone verte, le procd est sous contrle et lon a une forte probabilit
que le Cm soit au moins de 1,33.
On peut calculer dans le cas dune production centre, distribue selon une loi normale, la
probabilit p quau moins une pice sur les 5 prleves soit hors de la zone verte.
Cm 2 1.5 1.33 1 0.8
p 1.5% 11.6% 20.8% 51.2% 71.7%
Figure 14
Pour effectuer un pilotage du procd, on prlve deux observations conscutives de faon
priodique. La priode dchantillonnage est fixe un sixime de la priode moyenne sparant
deux interventions. Cinq rgles rgissent le fonctionnement des cartes de pr-contrle (Figure 15).
14
BHOTE K. R. World Class Quality - Amacom -1991 -225p
Schma Description Action
1
Les deux observations sont dans
la zone verte.
Continuer la production
2
Une observation dans la zone
verte, une autre dans la zone
jaune.
Continuer la production
3
Deux observations dans la mme
zone jaune.
Rgler le procd
4
Une observations dans chaque
zone jaune
Arrter le procd et rechercher
les causes de dispersion.
5
Une observation dans la zone
rouge
Arrter le procd et trouver la
cause du critre dfectueux
Figure 15
Les cartes de pr-contrle ont lavantage de fournir une mthode trs simple. Cependant elles
peuvent avoir un certain nombre dinconvnients relatifs leur efficacit.
- La faible taille des chantillons ne permet pas de dtecter de petites drives. Cest pourquoi il est
impratif de nutiliser cette mthode que pour des machines ayant une bonne capabilit, sans
quoi on risque de produire beaucoup de critres hors des spcifications.
- Les cartes de pr-contrle ne fournissent aucune mthode pour le rglage du procd.
- La taille des chantillons nest pas lie lefficacit.
Etude de performance des cartes de contrle
Les tudes de performance des cartes de contrle ont deux objectifs : elles permettent, dans un
premier temps, dorienter le choix sur un type de carte de contrle, selon le niveau de performance
souhait. Dautre part, les cartes de contrle tant des mthodes de test par prlvement
dchantillons, leur capacit dtecter une drive est troitement lie la taille des chantillons. Il
est donc possible doptimiser la taille des chantillons en fonction de la sensibilit requise.
Deux mthodes sont employes pour exprimer lefficacit dune carte de contrle.
On trouve pour certaines cartes, des abaques fournissant la probabilit de conclure que le procd
est centr en fonction du dcentrage de la population et de la taille des chantillons.
Un autre indicateur, est la Priode Oprationnelle Moyenne (P.O.M. ou Average Run Length) qui
reprsente le nombre moyen dchantillons successifs avant la dtection dun point hors contrle
On peut caractriser la sensibilit dune carte de contrle par sa P.O.M. dans deux tats du
procd : La P.O.M. pour un procd centr est note POM
0,
et la P.O.M. pour un procd dcentr
de k est note POM
k
. Le dcentrage k est lcart rduit entre la cible et la moyenne du procd : k=
(-cible)/o.
La norme AFNOR [AF0 95]
15
prconise dutiliser POM
1
.(dcentrage dun cart-type) et considre
quune bonne carte de contrle doit rentrer dans le gabarit suivant : POM
0
> 100 et
1 <POM
1
< quelques units.
P
.
O
.
M
.
k
1
5
100
Figure 16
Si la POM
0
est importante, cela signifie que pour un procd centr, le nombre de fausses alertes
est faibles (risque o).
Si la POM
1
est faible, le temps de dtection dun dcentrage dun cart-type est court. Cest donc
que la carte est sensible aux dcentrages.
Le choix des limites dune carte de contrle rsulte le plus souvent dun compromis entre ces deux
P.O.M. En effet, le choix dune POM
0
leve implique une POM
1
leve. Il est donc ncessaire de
relaxer lune des contraintes pour obtenir des performance acceptables
15
AFNOR Norme NF X 06-031-0 Application de la Statistique - Cartes de contrle - Principes Gnraux 1995
Le choix dune mthode statistique
Nous avons rappel dans le dbut de ce chapitre un certain nombre de mthodes statistiques qui
sont utilises dans le cadre de la M.S.P. Ces mthodes obissent bien entendu un certain nombre
dhypothses statistiques, qui permettent dchafauder un modle.
Il est possible denvisager plusieurs modles pour traiter un problme. Le rsultat obtenu dpendra
de la validit du modle et de lefficacit de la mthode employe ; lun et lautre tant troitement
lis.
Ce paragraphe a pour objectif de rappeler quelques notions sur la statistique non paramtrique et
lefficacit des mthodes statistiques. Ces deux thmes constituent en effet, le cur de la
problmatique que nous dvelopperons dans le chapitre suivant.
Problmatique de la modlisation
La majorit des mthodes de la Matrise Statistique des Procds abordent les problmes
destimation dun point de vue paramtrique. En effet, partant dun constat exprimental, on
suppose que la distribution des observations peut tre caractrise par une loi ou une famille de lois.
Cette famille de lois est elle-mme fonction dun nombre restreint de paramtres, comme la
moyenne et lcart type pour une loi normale. Une telle approche peut tre parfaitement approprie
si la famille des lois de probabilit est lie certaines caractristiques physiques du procd.
Dans certains cas, cette loi simpose delle mme. On peut citer par exemple la loi
hypergomtrique lorsque lon fait du contrle aux attributs.
A loppos, dans de nombreux cas, il sagit de choisir une loi sachant quelle conditionne de
manire importante ltude statistique dun phnomne. Le choix dun modle est en effet une
formalisation mathmatique des hypothses faites sur les observations. Bien que cette formalisation
soit importante, elle est souvent nglige au profit du choix de la mthode statistique employer.
Or il est bien vident que la mthode de rsolution du problme dpend particulirement du modle
adopt.
Le dveloppement rcent de la statistique mathmatique a t domin par ltude des formes faibles
du modle statistique. Cest dire que lon postule des hypothses relativement plus faibles que sur
une structure paramtrique classique. Cette problmatique a donn naissance deux approches :
- Lapproche non paramtrique (ce qui ne veut pas dire que les paramtres disparaissent) qui
consiste se placer dans une large classe de lois de probabilits plutt que dans une famille
paramtrique donne.
- La robustesse dont la principale proccupation est de mettre en oeuvre des estimateurs qui
liminent les valeurs extrmes, mais aussi dtudier la stabilit dune procdure statistique
lorsquon sloigne du modle pour lequel elle est optimale.
Les modles paramtriques
On considre quun modle paramtrique dcrit un ensemble de lois, tel que deux lois quelconques
de cet ensemble ne diffrent entre elles que par la valeur dun paramtre.
Le modle paramtrique le plus connu pour dcrire la distribution dobservations relles est le
modle normal qui regroupe lensemble des lois normales.
Ce modle est dcrit de la manire suivante :
On considre un couple de paramtre (,o
2
) dans RR
+*
tel que X est une observation de la loi
N(,o
2
).
f ( x)=
e

( xm)
2
2 s
2
.2 ps
2

Modles non paramtriques
A la diffrence dun modle paramtrique qui spcifie la loi de chaque observation par la valeur
dun paramtre, un modle non paramtrique laisse beaucoup plus de souplesse quant la forme et
la nature possible des lois des observations. Bien que les modles paramtriques soient
particulirement apprcis pour leur simplicit et la prcision des descriptions offertes, ils sont dans
bien des cas peu envisageables. Pendant trs longtemps, le dveloppement des mthodes
statistiques et ltude de leurs proprits ont t fonds essentiellement sur la normalit de la
famille de lois. Or la validit dun tel modle nest pas toujours assure.
En effet, diffrents facteurs comme des erreurs dexprimentation, des erreurs de mesures ou
encore des perturbations alatoires non prises en compte dans le modle peuvent rendre un modle
paramtrique inexact.
Les modles non paramtriques fondamentaux pour une observation sont :
- le modle de localisation,
- le modle dchelle
- et le modle de localisation-chelle.
Avant de prsenter ces modles non paramtriques, dfinissons un ensemble de lois.
On considre tout dabord un ensemble F des lois continues, dfinies sur R.
Un sous ensemble de F, est lensemble F
0
des lois mdiane nulle ( F ( 0 )=1/ 2 ).
Et enfin un sous ensemble de F
0
, est lensemble F
s
des lois symtriques par rapport lorigine (
F ( x)=1F (x) ).
Modle de localisation pour une observation
Il existe F appartenant F
0
et appartenant R tels que X est une observation de la loi F

dfinie
par :
xR,F rSub { size 8{m} } left (x right )=F left (x-m right )} {}
i
Modle dchelle pour une observation
Il existe F appartenant F
s
et o appartenant R
+*
tels que X est une observation de la loi F
o
dfinie par :
xR,F rSub { size 8{s} } left (x right )=F left ( {x} slash {s} right )} {}
i
Modle de localisation chelle pour une observation
Il existe F appartenant F
s
et (,o) appartenant RR
+*
tels que X est une observation de la
loi F
,o
dfinie par :
xR,F rSub { size 8{m,s} } left (x right )=F left ( { left (x-m right )} slash {s} right )} {}
i
Pour ces diffrents modles, et o sont respectivement appels paramtres de localisation et
paramtres dchelle.
Nous verrons au chapitre 3, lapplication dun estimateur construit sur un modle linaire
localisation chelle. Ce modle est un peu diffrent de celui prsent prcdemment puisquil
concerne un chantillon.
Modle de localisation chelle pour un chantillon
Il existe F appartenant F et (,o) appartenant RR
+*
tels que X
1
, ..., X
n
est un chantillon
de la loi F
,o
dfinie par :
xR,F rSub { size 8{m,s} } left (x right )=F left ( { left (x-m right )} slash {s} right )} {}
i
Mthodes non paramtriques
Avant de donner une dfinition des mthodes non paramtriques, rappelons ce quest une mthode
paramtrique. La notion de mthode paramtrique est assez bien partage par les statisticiens : elle
consiste chercher une solution optimale selon deux critres de qualit qui sont la validit et
lefficacit. Par exemple : un estimateur variance minimale (efficacit) parmi les estimateurs sans
biais (validit).
Lobjectif des mthodes non paramtriques est un peu diffrent puisquil consiste rechercher des
solutions qui sont applicables pour un vaste domaine de lois spcifies par le modle. On souhaite
en effet que la validit des rsultats ne dpende pas trop fortement de la loi des observations. Il faut
cependant garder lesprit que la solution est rarement indpendante de la loi. Alors que la validit
dun rsultat est parfois peu sensible aux types de lois considres, lefficacit des solutions dpend
gnralement de ces lois.
Nous souhaiterons donc galement que lefficacit de la mthode soit raisonnable.
Qualit des mthodes non paramtriques
Le choix dune mthode statistique est souvent conditionn par sa qualit par rapport dautres
mthodes statistiques. Dans le cas de mthodes non paramtriques, il semble naturel de comparer
les rsultats obtenus ceux dune autre mthode non paramtrique dans des conditions
quivalentes. Il est galement trs instructif de comparer ces rsultats ceux dune mthode
paramtrique. En effet, lutilisation dune mthode non paramtrique sous un modle paramtrique
donn peut occasionner une perte defficacit importante par rapport la mthode paramtrique
optimale. Il est donc bon de savoir si llargissement du domaine de validit des modles nest pas
trop pnalisant dun point de vue de lefficacit. Dans ce cas on tudie les variances respectives des
estimateurs, ce qui se traduit par le calcul de lefficacit relative.
Outre les performances lintrieur dun modle spcifi, la qualit dune mthode se juge aussi
suite une dviation du modle. Cest pourquoi la statistique non paramtrique se proccupe
particulirement de cette notion quest la robustesse.
Performances dun estimateur
Lun des problmes qui se pose frquemment aux utilisateurs de la statistique consiste choisir
entre plusieurs estimateurs dune mme quantit pour rsoudre un problme. Le choix dun critre
est alors primordial pour dterminer si un estimateur est prfrable un autre. La comparaison de
lefficacit de deux estimateurs suscite alors deux questions : lestimateur choisi est il le meilleur
parmi tous les estimateurs (efficacit absolue) ? ou bien est-il tout simplement le meilleur dans une
classe destimateurs donne (optimalit) ?
Efficacit dun estimateur
Estimation ponctuelle
Avant daborder ces notions de performance des estimateurs, rappelons ce quest une estimation
pontuelle.
On dispose dune information sur la loi F(X) par un chantillon (x
1
, ... , x
n
) de la variable X.
est un paramtre de la loi que lon souhaite estimer.
On note j ( m) une grandeur que lon cherche estimer. Souvent cette grandeur nest autre que le
paramtre lui mme. Cest le cas lorsque lon cherche estimer la moyenne dune loi normale.
Cependant, il arrive que la grandeur estimer soit une fonction de : par exemple lorsquon
sintresse la variance dune loi normale o et non son cart-type o.
On appelle estimateur ponctuel de j ( m) toute statistique T
n
construite sur lchantillon

X
n
.
Lerreur quadratique moyenne
La dmarche utilise pour comparer deux estimateurs repose sur le calcul dune perte quadratique
engendre par lestimation. Il sagit de lerreur quadratique moyenne (Eq 0).
EQ
(
n , m
0
)
=E
| (
T
n
j
(
m
0
) )
2

Eq 0
Le critre EQ(n,
0
), que lon cherche minimiser, reprsente lesprance du carr des carts entre
les ralisations de lestimateur T
n
et les vraies valeurs de (
0
)
Il apparat alors logique de prendre parmi deux estimateurs, celui dont lerreur quadratique
moyenne est la plus faible.
Si les estimateurs sont sans biais pour un mme paramtre, lerreur quadratique moyenne nest
autre que la variance de lestimateur. On dit dailleurs quun estimateur sans biais est plus efficace
quun autre estimateur si sa variance est plus petite.
Si lestimateur T
n
est un estimateur quelconque, lerreur quadratique moyenne scrit (Eq 0) :
EQ
(
n , m
0
)
=E
| (
T
n
E
(
T
n
) )
2

+
(
E
(
T
n
)
j
(
m
0
) )
2
EQ
(
n , m
0
)
=Var
(
T
n
)
+b
2
(
n , m
0
)
Eq 0
Lerreur quadratique moyenne est un critre qui tient compte la fois du biais et de la dispersion de
lestimation. Ainsi mme si un estimateur sans biais est intuitivement sduisant, on pourra lui
prfrer un estimateur faiblement biais mais de plus faible variance.
Lefficacit relative
Afin de comparer les qualits respectives de deux estimateurs sans biais, on calcule souvent le
rapport de leurs variances ou de leurs variances asymptotiques.
Soient T
n
et T
n
deux estimateurs dfinis partir dobservations indpendantes dune loi F.
On appelle alors efficacit relative de T
n
par rapport T
n
la quantit (Eq 0) [Cap 88] :
ER( T
n
, T
n
' )=
Var
(
T
n
'
)
Var
(
T
n
)
Eq 0
J. Pitman [Pit 48]
16
introduit une notion defficacit relative lgrement diffrente. Il pose le
problme de la manire suivante :
Si on considre deux statistiques T
n
et T
n
quivalentes selon un certain critre (ce peut tre la
variance) et pour des tailles dchantillons n et n . Le rapport n/n est appele efficacit relative de
T
n
par rapport T
n
.
Nous considrons pour notre part que la premire dfinition de lefficacit relative est plus
satisfaisante car elle nous permet de comparer les performances de deux estimateurs pour un
nombre dobservations donnes. La M.S.P. accorde en effet beaucoup dimportance la taille des
chantillons car elle a une influence conomique et pratique capitale. De plus, la relation (Eq 0)
permet dobtenir la formule de lefficacit relative asymptotique lorsque lon fait tendre le nombre
dobservations vers linfini.
Dans bien des cas, la variance exacte dun estimateur fonction de n observations est difficile
obtenir. Aussi un critre souvent utilis pour comparer deux estimateurs est lefficacit relative
asymptotique (Eq 0) :
ERA( T
n
, T
n
' )=Lim
n-
Var
(
T
n
'
)
Var
(
T
n
)
Eq 0
La borne de Frechet
Il parat vident que la variance dun estimateur T ne peut tre nulle. Il est alors logique de se poser
la question de lexistence dune borne infrieure.
On peut montrer en effet que la variance dun estimateur ne peut tre infrieur une limite appele
Borne de Frechet ou Borne de Cramer-Rao. Un estimateur sans biais est dit efficace si sa variance
est gale la borne de Frechet [Tas 89]
17
.
La moyenne est par exemple lestimateur efficace lorsque les observations suivent une loi normale
(Voir Annexe 2).
Rappelons que cette borne nest valable que pour des distributions dont le support ne dpend pas du
paramtre estim.
Loptimalit
Lorsque la borne de Frechet nest pas atteinte, et cest souvent le cas, on affaiblit le critre de
lefficacit absolue pour se contenter dun estimateur optimal. On appelle estimateur optimal un
estimateur T sans biais, prfrable tout autre au sens de la variance.
T rSub { size 8{1} } B rSub { size 8{0} } V left (T right ) <= V left (T rSub { size 8{1} } right )} {}
i
16
PITMAN E. J. Notes on non parametric statistical inference - Manuscrit non publi
17
TASSI P. Mthodes Statistiques - Economica 2nde Edition - 1989
Robustesse dun estimateur
Ltude de la robustesse dun estimateur consiste, entre autre, quantifier sa tolrance aux valeurs
extrmes et sa sensibilit de nouvelles observations. La taille des chantillon tant le plus souvent
constante en M.S.P. grandes sries, on ne sintressera qu la proprit de tolrance aux valeurs
extrmes dun estimateur. Pour cela on dfinit un coefficient de tolrance.
On suppose un estimateur T
n
fonction des observations X
1
, ... ,X
n
. Soient o et | deux entiers tels
que :
-
left (x rSub { size 8{1} } ,K,x rSub { size 8{n} } right )R rSup { size 8{n} } ,x rSub { size 8{ left (+1 right )} } <= t rSub { size 8{n} } <= x rSub { size 8{ left (n- right )} } } {}
i
- si lon fixe les valeurs de x
(o+2)
,...x
(n)
et que
x
( +1 )
--
alors
t
n
--
- si lon fixe les valeurs de x
(1)
,...x
(n-|-1)
et que
x
( n)
-+
alors
t
n
-+
Si o* et |* sont respectivement les plus petits entiers satisfaisant les conditions prcdentes. On dit
alors que le coefficient de tolrance gauche est t(T
n
)= o*/n et le coefficient de tolrance droite
est t(T
n
)= |*/n.
Si lestimateur a des proprits de symtrie, on trouve o* = |*.
On appelle point de rupture asymptotique la grandeur o*/n, lorsque n- .
On peut donner titre dexemple le coefficient de tolrance pour la mdiane empirique et la
moyenne empirique (Figure 17).
n t
(

X
n
)
t
(

X
n
)
5 0 0.40
10 0 0.40
20 0 0.45
100 0 0.49
+
0 0.50
Figure 17
Cet exemple met en vidence la grande robustesse de la mdiane empirique par rapport la
moyenne empirique qui ne tolre aucune observation aberrante.
Orientation des travaux
Les principes de base de la M.S.P. et leurs limites
Dans les premires heures de la M.S.P, les industriels se contentaient dappliquer la MSP dans des
cas o les hypothses des outils statistiques utiliss, ntaient pas trop mises mal. Le
dveloppement de ces mthodes et leur gnralisation dans lentreprise, ont conduit tout
naturellement les ingnieurs se confronter des cas atypiques o lapplication de la MSP pouvait
tre discutable.
Nous pouvons citer parmi ces cas :
- Les cas o les donnes sont corrles (procds continus), ce qui rend difficile lestimation de la
dispersion instantane et biaise lestimation de position du procd.
- Les petites sries ou de manire gnrale les procds offrant un faible volume dinformation
sur leur volution, conduisant ainsi des difficults dchantillonnage et destimation de la
dispersion instantane.
- Les procds non normaux qui remettent en cause le calcul des indicateurs de capabilit ainsi
que celui des limites pour une carte de contrle.
Orientation de nos travaux
Le travail que nous allons dvelopper dans ce mmoire concerne lapplication dune mthode non
paramtrique la M.S.P. Les outils statistiques de la M.S.P, comme nous venons de le voir, se
basent pour la plupart sur un modle paramtrique de loi. La loi normale est lun de ces modles
incontournables, dont lutilisation est souvent justifie. Nanmoins cette approche souffre de
ltroitesse de son cadre dapplication et les exemples de non normalit que nous soumettent les
industriels illustrent bien ses limites. Nous proposerons donc une approche plus gnrale, ne
postulant aucune loi a priori, permettant de construire des cartes de contrle dont les performances
sont suprieures celles des cartes utilisant la moyenne.
Nous verrons dans le Chapitre 2 que la MSP nest pas sans rponses face aux cas de non normalit.
Nous rappellerons quelques unes des mthodes dveloppes au cours des dix dernires annes pour
rpondre aux problmes poss quant lutilisation des cartes de contrle et des indicateurs de
capabilit. Aprs avoir analys et critiqu ces mthodes nous poserons une nouvelle problmatique.
Nous proposerons ensuite dans le Chapitre 3 lutilisation dune mthode non paramtrique dont
lobjectif est de fournir une carte de contrle possdant de bonnes performances quelle que soit la
distribution des observations. Deux objectifs sont alors poursuivis : la minimisation de la variance
des estimations ainsi que la minimisation de la perte au sens de Taguchi, occasionne par la
dispersion naturelle du procd.
Nous prsenterons enfin dans le Chapitre 4, quelques applications industrielles mettant en lumire
lefficacit de la mthode et son adquation au besoin industriel.
Chapitre 2
Chapitre 2
La non normalit aborde par la Matrise
Statistique des Procds
Le mythe de la loi normale
La loi normale prend une part trs importante dans les mthodes de dcisions statistiques. Ce
modle statistique a en effet lintrt incontestable de pouvoir dcrire avec simplicit un grand
nombre de phnomnes alatoires naturels. Son caractre nen est pas universel pour autant et on
constate que bon nombre dapplications statistiques ne peuvent se satisfaire de lhypothse de
normalit. Nous prsenterons dans ce paragraphe quelques exemples typiques de non normalits
rencontres couramment dans lapplication de la M.S.P.
Justification de la normalit
L'objectif de la M.S.P. est, comme nous l'avons vu au chapitre prcdent, de mettre un procd
sous contrle. C'est--dire liminer les causes spciales l'origine de non stationnarit du
procd, pour ne garder que les causes communes, non rductibles. Lorsque toutes les causes
spciales ont t limines, on considre que la distribution des critres tudis suit une loi
normale. Cette hypothse se justifie par le nombre important des causes communes et leurs effets
d'un ordre de grandeur quivalent.
D'autre part, pour des raisons d'efficacit que nous avons dj soulignes, on prfre utiliser des
cartes de contrle par chantillonnage de type

X /R . Mme si le thorme central limite n'est


valable que pour des chantillons de grande taille, il a une influence non ngligeable sur la
distribution des moyennes, calcules partir d'chantillons de faible taille. Ainsi, la distribution des
moyennes, suivra une loi normale si la distribution des valeurs individuelles ne prsente pas un
caractre non normal trop prononc. Dans ces mmes conditions, on ne peut tablir la distribution
de ltendue R et de lcart-type empirique S.
Toutefois le large dveloppement de la M.S.P, dans de nombreux domaines, a contribu la mise
en vidence de diffrents cas de non normalit. Nous allons voir que la non normalit d'un procd
n'est pas forcment le rsultat d'un procd mal matris au sens de Shewhart. Il existe en effet des
procds qui sont naturellement non normaux alors quils sont sous contrle. Cest le cas en
loccurrence des critres de forme. Dautres procds sont soumis des causes spciales
parfaitement identifies. En toute rigueur le procd nest pas sous contrle, mais on se satisfait de
cette situation pour des raisons techniques ou conomiques. Nous citerons dans cette catgorie, les
procds multipostes ou multi-empreintes.
Procds non normaux
Introduction
Si on tudie les critres suivis en M.S.P. sur un procd de fabrication, deux facteurs essentiels
peuvent tre l'origine de leur non normalit:
- Le premier est li la nature mme du procd. De nombreux procds sont en effet non
symtriques pour des raisons mcaniques ou physiques. Prenons par exemple le cas du remplissage
de bouteilles propos par R. Mortel [Mor 95]
18
. Ce procd est constitu de 24 ttes de remplissages
dont le dbit peut tre rgl indpendamment. A chaque cycle de remplissage, 24 bouteilles sont
remplies simultanment. On conoit aisment que les diffrentes buses ne peuvent pas avoir
rigoureusement le mme dbit. De plus celui-ci n'volue pas forcment de la mme manire dans le
temps. L'obstruction de l'orifice ou les bulles d'air sont autant de causes qui influent sur le dbit des
ttes de remplissage. La production ne suit pas une tendance centrale mais plusieurs, ce qui
explique la non normalit du procd.
- Le second dpend du type de donnes traites. En effet, certaines grandeurs physiques sont
bornes ou correspondent des singularits : une circularit est ncessairement positive, un pH de 0
ou une temprature de 0 Kelvin sont des singularits, donc des valeurs non galables. Ces
caractristiques introduisent bien entendu des dissymtries dans la rpartition des mesures. D'autre
part, les grandeurs reprsentes proviennent parfois d'un calcul bas sur plusieurs mesures. C'est le
cas par exemple de la circularit d'une pice mcanique qui se calcule en effectuant la diffrence
entre le diamtre du cercle inscrit et celui du cercle circonscrit. Ce problme est bien connu en
M.S.P. sous l'appellation de dfaut de forme.
18
MORTEL R.R. & RUNGE G.C. Statistical Process Control of Multiple Stream Process Journal of Quality
Technology Vol 27 N 1 - 1995
Les procds multignrateurs
Les procds multignrateurs, bien que peu abords en M.S.P. constituent une part importante des
moyens de production. On regroupe sous cette appellation tous les procds constitus de plusieurs
machines lmentaires indpendantes les unes des autres, ralisant les mmes caractristiques.
Nous citerons titre d'exemple les procds les plus classiques tels que les tours multibroches, les
presses injecter multi-empreintes, ou encore les filires.
Les caractristiques issues de chaque gnrateur ou machine lmentaire sont distribues selon une
loi lmentaire, qui peut tre une loi normale si la caractristique tudie est bilatrale, ou une loi
de dfaut de forme dans le cas d'un critre unilimite.
La population constitue de la production de l'ensemble des gnrateurs est ainsi un mlange de
lois, encore appel stratification (Figure 18).
Nous allons tablir les caractristiques essentielles de cette distribution, qui sont la moyenne et la
variance en fonction des diffrentes lois lmentaires.
Caractristique
Intervalle de tolrance
Caractristique
Intervalle de tolrance
Figure 18
Dans l'exemple de la Figure 18 on considre une population constitue de k=5 strates de moyenne
et d'cart-type respectif
i
et o
i
. En supposant que les gnrateurs produisent chacun t=1/5 de la
production, on dfinit alors la densit de probabilit de la population fp en fonction des lois
lmentaires f1 ... f2 par:
f f f
p
= + + t t
1 5
On note mi(q) les moments d'ordre q des variables alatoires distribues selon fi. X est la variable
alatoire de fp.
Les moments non centrs d'ordre q de la variable X se calculent par l'expression:
| | E X
q
i i
q
i
k
=
=

t
( )
1
D'o la moyenne et la variance (Eq 0):
| | E X
i i
i
k
=
=

t
1
V | X =E | X
2
E | X
2
=p

i=1
k
(
s
i
2
+m
i
2
)

|
p

i=1
k
m
i

2
Eq 0
La Matrise Statistique des Procds a pour objectif de rduire l'influence des causes spciales (ici
videntes) l'origine de la non normalit de la population. Cependant cette procdure peut s'avrer
trs dlicate et surtout trs coteuse : modification de la structure d'une machine ou encore retouche
de moules pour une presse injecter.
Considrons par exemple une presse injecter avec un moule comportant 10 empreintes identiques.
Malgr tout le soin que peuvent apporter les outilleurs dans la fabrication du moule, il est
impossible de raliser 10 empreintes identiques. A chaque injection, la presse va donc produire 10
pices provenant de 10 gnrateurs diffrents. Les critres tudis auront donc ncessairement une
distribution non normale. La population est alors dite stratifie . En revanche, on peut admettre
que les distributions lmentaires issues de chaque gnrateur (chaque moule) suivent une loi
normale.
Figure 19
Si, comme c'est le cas de la Figure 19, l'aptitude du procd est satisfaisante par rapport aux
tolrances respecter, faut-il chercher supprimer l'influence de la cause spciale ici vidente (les
diffrences entre les empreintes) ? Rduire les dissemblances consisterait alors retoucher les
moules. Cela coterait une fortune pour un rsultat trs hasardeux du fait des dispersions d'usinage.
Il nous semble prfrable dans ce cas, de considrer que les causes communes gnrent une
population non normale et d'essayer de piloter ce "paquet" pour le maintenir sur la cible.
Les dfauts de forme
Dans le domaine mcanique, les critres unilimites prsentent une part importante des critres
tudis [Joh 93]
19
. Les critres de forme tels que les rugosits, les planits, les circularits sont non
symtriques par nature puisque borns en zro. Prenons l'exemple d'un calcul de circularit (Figure
20) qui consiste faire la diffrence entre le rayon du cercle inscrit R
min
et le rayon du cercle
circonscrit de mme centre R
max
d'un alsage.
R
max
R
min
Figure 20
Ces deux variables alatoires sont supposes distribues selon une loi normale. La diffrence de ces
deux variables, note z = R
max
- R
min
, est distribue selon une loi normale N(m,o
n
), encore appele
loi normale sous-jacente. Cependant il existe une relation dordre entre R
max
et R
min
qui est
dordre dimensionnelle. On conoit aisment que R
min
sur une pice soit suprieur R
max
dune
autre pice si lcart entre la moyenne de chacune des variables est faible. En revanche, R
max
est par
dfinition suprieur R
min
sur une mme pice. La circularit est alors distribue selon une loi de
z=R
max
R
min

(loi de dfaut de forme), trs caractristique pour son repliement sur l'intervalle
positif. Cette loi est aussi connue sous le nom de loi normale replie.
Intervalle de tolrance
Loi de dfaut
de forme
Loi normale
sous-jacente
m
m: moyenne de la loi normale sous-jacente
m : moyenne de la loi de dfaut de forme
Figure 21
Pour que la caractristique de circularit suive une loi de dfaut de forme, il faut que les
mesures R
min
et R
max
suivent une loi normale de mme cart type.
19
JOHNSON N. L. KOTZ S. Process Capability Indices - Chapman & Hall - 1993
De manire plus gnrale, on note z la variable alatoire distribue selon la loi normale
sous-jacente N(
n
,o
n
), obtenue partir des variables x et y (R
max
et R
min
dans lexemple
prcdent).
La moyenne de z est donne par :
E | z =m
n
=E | x E | y
La loi de dfaut de forme sexprime donc par l'expression (Eq 0) :
z0}} {}
f
d
( z )=
1
s
n
.2 p
|
e

1
2 (
zm
n
s
n
)
2
+e

1
2(
z+m
n
s
n
)
2

i
i
Eq 0
La moyenne et la variance de la loi normale replie sont donnes par (Eq 0)
m=s
n
.
2
p
e
(

(
m
n
/ s
n
)
2
2
)
m
n
(
12 F
(
m
n
/ s
n
) )
s
2
=m
n
2
+s
n
2
m
2
Eq 0
Critres de position
Un autre cas de non normalit concerne les caractristiques distribues de faon circulaire autour
d'un point central. Pour dcrire de tels critres, on utilise la loi de Rayleigh.
On considre le cas d'un alsage effectu sur une machine commande numrique. Ses
coordonnes sont programmes selon les coordonnes rectangulaires qui correspondent aux axes de
dplacement de l'outil, dans le plan perpendiculaire l'axe de perage. La dispersion occasionne
par le jeu cinmatique des deux axes suit une loi normale. Il n'en est pas de mme pour les
coordonnes polaires. Les positions radiales sont distribues suivant une loi de Rayleigh (Figure 4)
tandis que les positions angulaires suivent une loi uniforme.
On est souvent confront ce type de mesure de distance radiale en mcanique ; tude d'une
coaxialit par exemple.
En supposant que les caractristiques des deux lois normales, dcrivant les variations de position en
coordonnes rectangulaires, soient parfaitement connues, on peut alors tablir l'expression de la loi
de Rayleigh et dterminer ses paramtres.
X
Y
o
n
m
r
r
o
r
o
n
m
r
o
n
Figure 22
La fonction de rpartition F et la densit de probabilit f s'crivent respectivement:
( ) ( )
| |
F r e f r
r
e r
r
n
r
n n
= = e

1 0
2
2
2
2
2
2
2 o o
o
,
La moyenne et l'cart type de la loi de Rayleigh sont donns par:
m
r n n r n n
= ~ = ~
t
o o o
t
o o
2
125 2
2
0 655 , ,
Il est possible de gnraliser cette approche pour les cas o la moyenne des variables X et Y ne
correspond pas avec le centre du cercle.
Rpercussions de la non normalit sur les mthodes de la
M.S.P.
L'analyse de capabilit et le pilotage de procds par cartes de contrle sont le plus souvent fonds
sur l'hypothse de normalit. Cependant les procds non normaux sont relativement frquents,
nous l'avons vu prcdemment, ce qui peut nous conduire remettre en cause la validit de ces
mthodes. Lappellation non normalit regroupe une grande varit de lois dont les
caractristiques sont parfois trs diffrentes de la loi normale. C'est pourquoi il serait dangereux de
conclure que les mthodes de la M.S.P. sont applicables ou inapplicables dans un contexte non
normal. Il serait plus juste de se demander si ces mthodes sont robustes et tolrent quelques carts
par rapport un modle ; ici la loi normale.
Incidence sur les indicateurs de capabilit
Les indicateurs de capabilit ont pour objectif de dterminer dans quelle mesure un procd de
fabrication peut respecter les spcifications que l'on s'est fix. Bien que le calcul des indicateurs de
capabilit tels que le Cp et le Cpk (Eq 0) repose uniquement sur la comparaison entre la tolrance
et la dispersion d'une caractristique, celui-ci impose la connaissance a priori de la distribution des
donnes. On souhaite gnralement que les donnes soient distribues selon une loi normale.
Cp=
IT
6 . s
Cpk=
min ( mTI ; TSm)
3 . s
Eq 0
La connaissance de la loi de distribution des mesures permet en effet de faire le lien entre la valeur
de l'indicateur de capabilit et le pourcentage de mesures hors tolrances. Pour un Cpk donn, il est
facile l'aide d'une table de la loi normale rduite de connatre le pourcentage hors des tolrances.
Malheureusement ce calcul n'est plus possible lorsque la distribution des mesures ne suit pas une
loi normale. Il devient alors aventureux de comparer des indices de capabilit si l'on n'est pas
certain de la normalit de la loi ou si les deux productions non normales peuvent tre dcrites par
une mme loi. Gunter [Gun 89]
20
est l'un des premiers avoir abord ce problme d'interprtation
des indicateurs de capabilit en montrant que des productions non normales diffrentes ayant le
mme Cp et Cpk gnraient des pourcentages de non conformits diffrents.
Tout le problme se rsume la dfinition de la dispersion des mesures lorsque la production n'est
pas dcrite par une loi normale. La situation de rfrence que nous connaissons est celle de la loi
normale. En effet, lorsque l'on dfinit sa dispersion 6o on sait que la proportion de la population
situe dans l'intervalle m!3 s est de 99.73% (Figure 5).
20
GUNTER The use and abuse of Cpk - Quality Progress 22(3), pp108-109 & 22(5), pp 79-80 - 1989
TS TI
Dispersion
99.73%
Intervalle de tolrance
Figure 23
Ds lors que l'on dfinit la dispersion comme tant l'intervalle renfermant 99.73% de la population,
les indicateurs de capabilit peuvent tre interprts indpendamment de la distribution de la
population. La dtermination de la dispersion n'est pas une chose aise d'un point de vue
exprimental, lorsque l'on ne peut s'appuyer sur un modle statistique. Nous verrons dans le
paragraphe suivant quelques mthodes permettant de rpondre ce problme.
Dterminer les limites des cartes de contrle
De nombreuses tudes concernent l'impact de la non normalit sur l'efficacit des cartes de
contrle. Burr [Burr 67]
21
, par exemple a montr que les cartes de contrle ne pouvaient tre
raisonnablement utilises que si la population ne se rvlait pas fortement non normale. Shilling et
Nelson [Shi 76]
22
ont alors cherch dterminer quelles taient les domaines d'applications valides
des cartes de contrle. L'une des rpercussions essentielles de la non normalit sur les performances
d'une carte de contrle est la modification des risques o lis aux tests d'hypothse. Shilling et
Nelson considrent que le domaine d'application d'une carte

X n'est valide que pour un risque o


proche de 0.3%. Pour cela deux alternatives sont envisageables : soit la distribution des moyennes
suit une loi normale et on garde les limites traditionnelles (
Cible!3 s
X
), soit il faut modifier les
limites de contrle.
Les auteurs ont donc calcul les risques pour diffrentes lois non normales et pour diffrentes tailles
d'chantillons. Les rsultats obtenus ne permettent pas de conclure une quelconque mthode pour
tablir les limites de contrle. Cependant, ils confirment que les risques o sont dans la plupart des
cas trs diffrents de 0.27% si l'on s'en tient aux limites habituelles
Cible!3s
X
. De plus, on peut
constater que le thorme central limite n'est pas un bon argument pour placer des limites de
contrle
Cible!3 s
X
lorsque les chantillons sont de taille moyenne. En effet, la convergence en
loi de la distribution de la moyenne est parfois trs lente. A titre d'exemple, le tableau (Figure 24)
donne la taille minimum d'un chantillon pour obtenir des risques de l'ordre de 0.3% pour
diffrentes lois de distribution de la population.
21
BURR, I. W. The effect of Non-Normality on constants for
X and R charts Industrial Quality Control, Vol. 23,
N11, pp563-568 Mai 1967
22
SHILLING E.G. & NELSON P.R. The effect of non normality on the control limits of Xb charts - Journal of
Quality technology - Vol 8 N4 pp183-188 - 1976
Type de loi Echantillon mini
Uniforme n>25
Gamma o=1/2
n>100
Gamma o=1
n>100
Gamma o=2
n>100
Gamma o=3
n>50
Gamma o=4
n>50
Bimodale symtrique n>500
Bimodale dissymtrique n>25
Figure 24
Pour chacun de ces cas, les tailles d'chantillons sont rdhibitoires pour lutilisation des cartes de
contrle. En pratique, on considre souvent que des risques infrieurs 0.3% permettent une
utilisation satisfaisante des cartes de contrle. Dans ce cas les chantillons minimum sont dune
taille plus acceptable pour la loi uniforme et la loi bimodale symtrique (Figure 25).
Type de loi Echantillon mini
Risque pour n=5
Uniforme 2 0.00094
Gamma o=1/2
331 0.01
Gamma o=1
166 0.0093
Gamma o=2
83 0.0067
Gamma o=3
56 0.0056
Gamma o=4
42 0.0049
Bimodale symtrique 2 0.0008
Bimodale dissymtrique 47 0.005
Figure 25
On retiendra essentiellement deux thses dans le choix des limites dune carte de contrle :
- Une premire approche que lon qualifiera de puriste tend garder les risques o aussi
proches que possible de 0.27% pour la carte des moyennes, quel que soit le type de distribution
aborde. Nous dcrirons dans ce chapitre quelques unes des mthodes permettant daboutir ce
rsultat. Nous citerons par exemple les travaux de Yourstone [Your 92]
23
qui suggre un
ajustement des limites de contrle bas sur une identification de la distribution de la population.
- Une autre approche, un peu plus pragmatique consiste placer systmatiquement les limites
de contrle
!3 s
estimateur
quelle que soit la carte utilise. Ce choix de lintervalle de confiance
bien que simpliste, fait nanmoins autorit puisque les cartes de contrle les plus rpandues
utilisent ce type de limites. Parmi ces cartes, nous pouvons citer la carte aux cart-types (S), la
carte aux tendues (R), les cartes aux attributs (p,np c et u) pour lesquelles lestimateur utilis ne
suit pas une loi normale.
23
YOURSTONE Steven A. & ZIMMER W.J. Non normality and the design of control; charts for averages
Decision Science Vol 23 N5 pp 1099-1113 - 1992
David [Dav 81]
24
considre en effet, que lajustement des limites de contrle dans le but de
conserver des risques proches de 0,27% est un raffinement dont lapport pratique est limit.
Wheeler [Whe 92]
25
adopte le mme point de vue et montre pour plusieurs exemples de distributions
non normales que la distribution des moyennes offre des risques o dun ordre de grandeur trs
raisonnable pour de faibles tailles dchantillons.
Incidence sur le choix de lestimateur
La problmatique ne se borne malheureusement pas au calcul des limites pour une carte de
contrle. Le problme de lestimateur ponctuel est aussi un lment important. Nous savons par
exemple que si la population est distribue selon une loi normale, alors la moyenne est le meilleur
estimateur sans biais qui puisse exister. En effet, sa variance atteint la borne de Frechet qui fixe la
variance thorique minimum de lestimateur en fonction de linformation qui lui est fournie. Quen
est il lorsque la population nest pas distribue selon une loi normale ?
On peut montrer par exemple que la mdiane est particulirement performante pour des lois
caractre impulsionnel, tandis que le milieu de ltendue aura un bon comportement pour des lois
proches de la loi uniforme.
Estimateur Domaine dapplication

X =X
(
n+1
2
)
(n impair)

X =
1
n

n
x
i
X
( n)
X
( 1 )
2
Figure 26
24
DAVID H. A. Order Statistics - New York - Willey - 1981
25
WHEELER D. J. Understanding Statistical Process Control - SPC press - 1992
Dautre part, les rgles de dcision telles que : 7 points conscutifs sont du mme cot de la cible
alors le procd est hors contrle nont plus la mme signification lorsque la distribution de
lestimateur nest pas symtrique. Quand la distribution de la population suit une loi normale, la
moyenne et la mdiane de la population sont superposes. Ainsi les probabilits que la moyenne
dun chantillon soit droite ou gauche de la moyenne de la population (

X ) sont gales. Cette


proprit est la base de ces rgles de dcision.
Or, lorsque la population est dissymtrique, la moyenne et la mdiane ne sont plus superposes.
Cela signifie que la probabilit quune valeur individuelle tombe droite de la moyenne nest pas
gale celle quelle tombe gauche. Le problme est donc le mme si la distribution de la
moyenne nest pas symtrique. La moyenne des moyennes est diffrente de la mdiane des
moyennes. En toute rigueur, le test nest plus valable.
La capabilit des procds non Normaux
Le calcul des capabilits pour les procds non normaux est un problme important tant donne la
forte sensibilit de ces indicateurs une dviation de la population par rapport au modle que
constitue la loi normale. Pour que les indicateurs de capabilit puissent tre exploitables
indpendamment de la forme de la population, il est ncessaire de dfinir la dispersion comme
l'intervalle centr couvrant 99.73% de la population.
On note
p
un p-quantile de la loi de distribution de la population. Alors les indicateurs de capabilit
peuvent scrire de manire gnrale :
Cp=
IT
D
et Cpk=
min
(
TSx
0 . 5
; x
0 . 5
TI
)
1
2
D
avec D=x
99. 865
x
0 . 135
Il est peu concevable destimer les p-quantiles de la distribution de la population en se basant
uniquement sur les mesures releves lors dune tude de capabilit. En effet, ces estimations
seraient trs approximatives du fait de linsuffisance des observations.
La littrature compte un nombre important de mthodes proposant une extension de la dfinition
des indicateurs de capabilit pour des lois non normales. Parmi elles on distingue quatre approches
fondamentalement diffrentes :
- Les mthodes les plus connues consistent faire lhypothse que la distribution peut tre
approche par une distribution thorique. Cette hypothse doit pouvoir se justifier par la nature
des observations, dfaut de forme par exemple. Dans le cas contraire, on appliquera un test
dadquation pour crditer lhypothse de dpart. Ces mthodes sont qualifies de
descendantes (top-down) car on postule une loi avant de pouvoir vrifier son adquation avec
les observations exprimentales. Elles seront abordes trs succinctement car elles sont dj trs
largement rpandues en milieu industriel.
- Dautres mthodes dites paramtriques empiriques sappuient sur des familles de lois de
distributions ou des familles de fonctions. Les familles de lois utilises telles que les lois de
Burr, lois de Pearson ou fonctions de Johnson ont la particularit de pouvoir dcrire un grand
nombre de configurations en faisant varier certains de leurs paramtres. A linverse des
mthodes prcdentes, les mthodes paramtriques sont ascendantes (bottom-up) car on
estime des paramtres partir des observations du procd pour en dduire la fonction
reprsentant le mieux la distribution de la population.
- Les mthodes graphiques reprennent pour la plupart la philosophie de lhistogramme en lui
apportant des proprits de continuit. Pour obtenir un histogramme liss on utilise par exemple
la mthode des noyaux (Kernel) ou encore un algorithme des splines cubiques.
- Il existe aussi quelques mthodes non paramtriques dont les principes, plus originaux, ne
sappuient sur aucune loi ou famille de lois pour calculer la dispersion.
Le cadre de travail dfini par un modle paramtrique peut tre parfaitement appropri lorsque
la famille des lois de probabilit est lie aux caractristiques physiques de lexprience.
Cependant, le choix dun modle statistique est souvent un procd simplificateur de la ralit.
Cest pourquoi il est parfois prfrable dutiliser les formes faibles dun modle statistique
lorsque la validit dun modle paramtrique est mis en doute.
Les indicateurs fonds sur des distributions thoriques
Les critres de forme
La difficult lie la loi de dfaut de forme, est dtablir sa dispersion, car sa forme varie en
fonction du dcentrage et de la dispersion de la loi normale sous-jacente. Il est donc ncessaire de
dterminer les caractristiques de la loi normale sous-jacente afin de connatre la dispersion de la
population.
Nous avons vu que la loi de dfaut de forme sexprime par la relation :
z0}} {}
f
d
( z )=
1
s
n
.2 p
|
e

1
2 (
zm
s
n
)
2
+e

1
2 (
z+m
s
n
)
2

i
i
On note et o la moyenne et lcart-type de la loi de dfaut de forme.
Nous distinguerons trois cas pour le calcul de la dispersion de la loi de dfaut de forme, en se
basant sur les valeurs du rapport /o (Figure 27).
- 1
er
Cas
Si le rapport /o < 1.323, la moyenne de la loi normale sous-jacente est infrieure 0, ce qui est
contraire aux hypothse de la loi de dfaut de forme. Dans ce cas, on suppose que la moyenne de la
loi de dfaut de forme est centre sur 0. La dispersion est alors dfinie par D=5o, ce qui correspond
99.74% de la population. (Voir en Annexe 2 les dmonstrations mathmatiques)
- 2
me
Cas
Lorsque le rapport est compris entre 1.323 et 3, on se place dans le cas ou une partie de la loi
normale sous-jacente est du ct ngatif. Dans ce cas les normes fournissent gnralement, sous
forme dun tableau la valeur du p-quantile
0.9973
dtermin partir du rapport /o ou de la moyenne
de la loi normale sous-jacente [AFN 94]
26
(Voir en Annexe 2).
26
AFNOR Norme NF E 60-181 Moyens de production - Conditions de rception -
Mthode dvaluation de laptitude raliser des pices - 1994
- 3
me
Cas
Lorsque /o > 3 la loi normale de dfaut de forme peut tre assimile une loi normale. On dfinit
donc la dispersion comme la somme de la moyenne de la loi de dfaut de forme et le p-quantile de
la loi normale
0.9973
.o, cest dire 2,78o que lon approxime parfois 3o.
Dans ces trois cas, la dispersion de la loi de dfaut de forme est dfinie par lintervalle qui couvre
99,73% de la population en partant de zro.
1
er
Cas 2
me
Cas 3
me
Cas
m
s
1 . 3236 1 . 3236
m
s
3 . 0 3 . 0
m
s
D=5 s
D=x
0 . 9973
s
D=m+3 s
D D D
Figure 27
La loi de Rayleigh
En ce qui concerne la loi de Rayleigh, les calculs permettant dtablir les indicateurs de capabilit
Cp et Cpk sont particulirement simples. On peut montrer [Sou 86]
27
que la portion de la loi de
Rayleigh couvrant 99.73% de la population est de 5.25 o
r
lorsquil ny a pas de dcentrage.
Les relations du Cp et du Cpk en fonction de lcart type des observations o
r
sont alors immdiates
(Eq 0).
Cp=
IT
Dispersion
=
IT
5 . 25 s
r
et Cpk=
TGm
r
5 . 25s
r
m
r
Eq 0
27
SOUVAY P. La statistique outil de la qualit Edition AFNOR - 1986
La loi Log-normale
Contrairement la loi de Rayleigh, la loi Log-normale na pas de justification physique. On doit
son utilisation sa simplicit. Elle permet de modliser assez fidlement des distributions bornes
telles que les dfauts de forme.
Le problme qui se pose encore est de calculer le p-quantile de la loi Log-normale correspondant
99.865% pour pouvoir calculer le Cpk.
Cpk=
TSm
x
99. 865
m
Rappelons tout dabord, que si une variable alatoire Y est distribue selon une loi normale, alors la
variable dfinie par X=exp(Y) suit une loi log-normale.
Une manire trs simple de trouver le p-quantile, est doprer une transformation vers la loi
normale toutes les ralisation de la variable X : Y=ln(X).
On calcule alors les paramtres caractristiques de la loi normale, qui sont respectivement la
moyenne m et lcart type o.
Si Y suit une loi normale N(m ;o), alors X=e
Y
suit une loi Log-normale dont lesprance vaut
e
( m+s
2
/ 2)
et le quantile 0.99865 de X vaut
e
( m+3 s)
. Do lexpression du Cpk (Eq 0).
Cpk=
TSm
e
m+3 s
m
Eq 0
Limite de ces mthodes
Les mthodes prsentes dans ce paragraphe font partie des grands classiques de la M.S.P. et
rpondent aux problmes les plus courants de non normalit. Elles ont lavantage dtre
relativement simples du fait des lois postules. Lexistence de tests dadquation pour la loi de
Rayleigh et la loi log-normale contribue aussi les rendre attrayantes.
Cependant les hypothses formules sont trs restrictives quant la dfinition des procds. En
effet, la loi de dfaut de forme ne concerne que des critres unilimites particuliers. La loi de
Rayleigh nest applicable que si les deux sources de dispersion sont orthogonales et ont mme
cart-type.
Ces diffrentes mthodes nont pas la prtention de rpondre tous les problmes de non normalit.
Cest cet inconvnient majeur qui a motiv le dveloppement de mthodes bases sur des familles
de lois, afin dlargir le domaine dapplication des indicateurs de capabilit un plus grand nombre
de lois non normales.
Indicateurs de capabilit fonds sur des familles de
distributions
Lintrt de ces mthodes paramtriques par rapport aux prcdentes est de mettre en uvre un
modle statistique plus gnral, valide pour une grande varit de formes de densits de probabilit.
Plusieurs auteurs ont propos l'utilisation de mthodes robustes pour estimer la capabilit de
procds dans le cas de lois non normales. Parmi eux, Clements [Cle 89]
28
suppose que la
distribution du procd peut tre reprsente par une loi de Pearson. Il fournit des tables qui
permettent de dterminer la capabilit du procd en fonction du coefficient de Skewness
.
b
1
et
de Kurtosis |
2
de la population. Dans le mme tat d'esprit, Farnum [Far 97]
29
propose la
construction dindicateurs de capabilit l'aide des lois de Johnson.
Bien quelles utilisent des modles diffrents, ces approches sont sensiblement quivalentes.
Lobjectif est en effet de dterminer les p-quantiles dlimitant la dispersion de la population en se
servant du modle que lon aura identifi.
La famille des lois de Burr
Le modle de lois propos par Burr [Bur 42]
30
permet de reprsenter les fonctions de rpartition
dune distribution contrairement aux lois de Pearson et Johnson qui dcrivent sa densit de
probabilit. La fonction de rpartition est introduite sous forme d'une quation diffrentielle.
On appelle loi de Burr une loi continue f(x) dont la fonction de rpartition F(x) satisfait l'quation
diffrentielle: F ' ( x)=F ( x) | 1F ( x) g ( x) o g(x) est une fonction non ngative.
La solution de cette quation diffrentielle s'crit:
F ( x)=
1
1+exp|G( x)
avec G( x)=

-
x
g( u) du une loi strictement croissante.
Pour pouvoir identifier la loi de distribution des donnes, Burr propose de calculer la somme des
moments centrs thoriques. M
k
=

x
k
| 1F ( x) dx

-
a
x
k
F ( x) dx
Cela permet de fournir les p-quantiles de la loi sans avoir calculer les probabilits en passant par
la densit de probabilit. Par contre il est ncessaire de connatre la forme a priori de la loi de
distribution.
28
CLEMENTS J.A. Process capability calculations for non normal distributions
Quality Progress - N22 pp95-100 - 1989
29
FARNUM R.N. Using Johnson curves to describe non-normal process data
Quality engineering 9(2) - pp329-336 - 1997
30
BURR, I. W. Cumulative frequency functions - Annals of Mathematical Statistics, N13, pp215-232 - 1942
Identification de la loi
Castagliola [Cas 96]
31
propose une variante de la mthode de Burr en construisant une fonction de
rpartition empirique F
e
(Eq 0) partir dun chantillon ordonn. La fonction F
e
ntant pas
continue, on ne peut lutiliser directement pour estimer les p-quantiles de la population.
F
e
( x)=

0, xx
( 1 )
k
n
, x
( k )
xx
( k+1 )
1, xx
( n)
Eq 0
O
x
( 1 )
, x
( 2 )
, K , x
( n)
est un chantillon ordonn de n observations du procd
x
1
, x
2
, K , x
n
.
En consquence, la fonction G
e
=ln
(
F
e
( x)
1F
e
( x)
)
ne peut tre calcule partir de F
e
que pour n-1
valeurs de x
(k)
(k=1, 2, ... , n-1). Pour obtenir une fonction continue, on propose de remplacer la
fonction G
e
inconnue par un polynme G
r
(x) dordre r. Ce polynme est obtenu en appliquant la
mthode des moindres carrs sur les n-1 couples { x
(k)
; G
e
(x
(k)
)}.
La fonction de rpartition scrit alors
F
r
( x )=
1
1+exp
|
G
r
( x )

.
Remarque
Quelques restrictions sont mettre concernant la fonction G(x). En effet, la fonction G(x) et donc
G
r
(x) doit tre strictement croissante. En consquence, il faut que le polynme G
r
(x) soit dordre
impair.
Construction des indicateurs de capabilit
A partir de la fonction de rpartition empirique F
r
(x), on calcule les probabilits davoir des
mesures lextrieur des tolrances p
i
et p
s

On peut crire le Cp et Cpk en fonction de la loi normale rduite :
Cp=
1
6
|
F
1
(
1p
s
)
F
1
(
p
i
)
Cpk=
1
3
min
|
F
1
(
p
i
)
, F
1
(
1p
s
)
31
CASTAGLIOLA Ph Evaluation of non normal Process capability indices using Burr's distributions
Quality engineering 8(4) pp587-593 - 1996
Grce ces formules, il est possible d'estimer les valeurs du Cp et du Cpk conformment leur
dfinition mme lorsque la loi est non normale. Pour cela, on se base sur les proportions hors
tolrances. Les indicateurs de capabilit Cp et Cpk obtenus (Eq 0) peuvent donc tre compars
ceux calculs dans le cas dune population normale.
TI TS
F
r
(TS) ( )
( ) u
1
F TS
r
Loi normale rduite Loi non normale
Figure 28
Cp=
1
6
|
F
1
(
F
r
( TS )
)
F
1
(
F
r
( TI )
)
Cpk=
1
3
min
|
F
1
(
F
r
( TI )
)
, F
1
(
F
r
( TS )
)
Eq 0
En utilisant cette transformation, P. Castagliola utilise implicitement la mdiane comme estimateur
de position de la population.
Conclusion
Lutilisation des courbes de Burr par Castagliola est assez originale car elle est fonde sur la
construction de la fonction de rpartition empirique de la population. Les courbes de Burr offrent
alors un cadre suffisamment souple pour dcrire un nombre important de lois.
Il faut toutefois prendre quelques prcautions pour que la mthode fournisse de bons rsultats. La
premire contrainte est de prlever au moins une centaine dobservations pour que la fonction de
rpartition empirique soit parfaitement dcrite, surtout au niveau des queues. Il faut ensuite
dterminer lordre du polynme G
r
(x) pour que son trac approche au mieux les donnes.
Castagliola nnonce malheureusement pas de rgle ce sujet.
La famille des lois de Pearson
Clements [Cle 89]
32
a propos, de son ct, une mthode de calcul des indicateurs de capabilit Cp
et Cpk en se basant non pas sur les lois de Burr mais sur les lois de Pearson.
La dmarche de Clements est peu prs quivalente celle de Burr, car il considre que la
dfinition des indices de capabilit Cp et Cpk est fonde sur le pourcentage hors tolrances.
On suppose que les courbes de Pearson peuvent tre caractrises partir de quatre paramtres qui
sont la moyenne, l'cart type, le coefficient de Skewness et le coefficient de Kurtosis. Ces diffrents
paramtres sont calculs partir de donnes exprimentales du procd.
On utilise la mdiane M plutt que la moyenne pour estimer de manire robuste la tendance
centrale de la population. Dautre part, les coefficients de Skewness et de Kurtosis sont construits
partir des moments d'ordre trois et quatre. Lauteur rappelle cet gard que la taille des
chantillons de capabilit ne doit pas tre infrieure n= 20. Ceci n'est absolument pas contraignant
pour raliser une tude ce capabilit car les normes imposent souvent des tailles dchantillons bien
suprieures.
A partir des diffrents paramtres des courbes de Pearson, Clements utilise le tableau tabli par
Gruska et Al [Gru 89]
33
pour connatre la dispersion de la population. En effet ce tableau fournit les
probabilits suprieure p
s
et infrieure p
i
des lois de Pearson rduites (=0 et o=1) en fonction des
coefficients de Skewness et Kurtosis.
Les indicateurs de capabilit obtenus par cette mthode scrivent alors sous la forme (Eq 0) :

C p=
USLLSL
p
s
p
i

C pk=min
(
USLM
p
s
M
;
MLSC
Mp
i
)
Eq 0
Par la suite, W. L. Pearn et S. Kotz [Pea 95]
34
ont tendu cette mthode de calcul d'autres
indicateurs de capabilit. Il s'agit en l'occurrence des indicateurs, dits de 2me et 3me gnration,
comme le Cpm, le Cpmk et le Cpm* (Eq 0).
La mise en place ne prsente aucune difficult supplmentaire ; il suffit pour les obtenir de
dterminer les p-quantiles dfinissant la dispersion.
32
CLEMENTS J. A. Process Capability Calculations for Non-normal Distributions
Quality Progress N22 - pp995-100, Sep 1989
33
GRUSKA G. F. MIRKHANI K. & LAMBERSON L.R. Non normal Data Analysis
Applied Computer Solutions Inc - 1989
34
REARN W.L. & KOTZ S. Application of clements method for calculating second and third generation capability
indices for non normal pearsonian population - Quality Engineering 7(1) pp 139-145 - 1995

C pm=
TSTI
6
| ( (
p
s
p
i
)
/6
)
2
+( MCible)
2

1/ 2

C pm
i
=
min ( TSM ; MTI )
6
| ( (
p
s
p
i
)
/6
)
2
+( MCible)
2

1/ 2

C pmk=min
|
TSM
3
| ( (
p
s
M
)
/3
)
2
+( MCible)
2

1/ 2
;
MTI
3
| ( (
Mp
i
)
/3
)
2
+( MCible)
2

1/ 2

Eq 0
Ces derniers rsultats nous semblent trs critiquables car la notion de perte est totalement
indpendante des pourcentages hors tolrances. Dans la philosophie originale du Cpm, on
considre, au contraire, que lutilisation de lindicateur Cpm est totalement indpendante de la
distribution de la population. Le Cpm est calcul partir de la fonction perte, qui ne tient compte
que de lcart quadratique des observations avec la cible (Voir Chapitre 1). La substitution de o par
(p
s
-p
i
)/6 est donc inadapte.
La mthode propose par Clements ne semble pas dnue dintrt et bon nombre dauteurs y font
rfrence. Cet engouement sexplique en grande partie par le caractre systmatique de la mthode
et sa simplicit. Elle se rvle dailleurs dune grande souplesse puisque les courbes de Pearson
permettent de reprsenter un grand nombre de situations. Cependant pour obtenir des rsultats
fiables, il est recommand de calculer les coefficients de Skewness et de Kurtosis sur un chantillon
de taille relativement importante, faute de quoi lestimation de la dispersion peut aboutir des
valeurs extravagantes.
La famille des lois de Johnson
Les courbes de Johnson furent prsente en 1949 comme une alternative aux lois de Pearson pour la
description des lois non normales. Leur principe est similaire aux lois de Pearson puisqu laide de
3 familles de lois, on peut dcrire une grande varit de formes de distributions. Lventail des
possibilits offertes par les courbes de Johnson est sensiblement quivalent celui des courbes de
Pearson. Les courbes de Johnson offrent nanmoins quelques avantages sur les courbes de Pearson.
En effet, elle bnficient de mthodes permettant de choisir la courbe qui dcrit le mieux la
population. Des transformations permettent galement de simplifier les problmes de calculs de
probabilit en se ramenant une loi normale rduite. De plus, lestimation des paramtres des
courbes est base sur une approximation de p-quantiles de lchantillon des observations. Cette
approche est gnralement plus fiable que les mthodes bases sur les moments comme celle
propose par Clements.
Prsentation des courbes de Johnson
Johnson a propos trois courbes pour dcrire diffrents types de distributions. Chacune delles peut
tre transforme (approximativement) en une loi normale rduite.
Les fonctions k
1
, k
2
et k
3
sont la base des transformations de variables que lon opre pour
ramener la distribution dune variable, dcrite par une loi de Johnson, une loi normale rduite.
-
k
1
( x , , e)=sinh
1
(
xe

)
Ces courbes sont dfinies sur un intervalle non born
(lensemble des rels).
-
k
2
( x , , e)=ln
(
xe
+ex
)
Au contraire cette quation dcrit des distributions qui sont
dfinies sur un intervalle ouvert ]c,c+[.
-
k
3
( x , , e)=ln
(
xe

)
Les dernires courbes sont de type log-normal et trouveront
leur application pour des critres unilimites comme les
dfauts de forme.
Choix de la famille de courbes
Slifker et Shapiro [Sli 80]
35
ont introduit une mthode base sur lapproximation de p-quantiles afin
de dterminer quelle est la courbe la plus mme de dcrire la distribution de la population.
La premire tape de cette mthode consiste choisir une valeur z et calculer les valeurs de la
fonction de rpartition de la variable N(0,1) en -3z, -z, z, 3z.
Les auteurs proposent de prendre z = 0.524.
Do P
-3z
= P
-1.572
= 0.058
P
-z
= P
-0.524
= 0.3
P
z
= P
0.524
= 0.7
P
3z
= P
1.572
= 0.942
On estime ensuite les p-quantiles de la population correspondant aux probabilits prcdentes. Ceci
peut tre fait laide dun chantillon ordonn comme le fait Castagliola pour la construction des
courbes de Burr.
A laide des p-quantiles que lon note x
-3z
, x
-z
,

x
z
, x
3z
, on calcule les coefficients m, n et p, qui
permettront de choisir la famille de courbes.
m = x
-3z
- x
-z
n = x
-z
- x
z
p = x
z
- x
3z
35
SLIFKER J. F. SHAPIRO S. S. The Johnson System : Selection and parameter estimation
Technometrics - Vol 22 N2 - pp239-246 - 1980
On distingue trois cas :
mn/p
2
< 1 mn/p
2
= 1 mn/p
2
> 1
Courbe Borne k
2
Courbe Log-normale k
3
Courbe non borne k
1
Le type de courbe tant dtermin, on estime les paramtres de la loi en appliquant les quations
ayant pour variables m, n et p. Pour plus de prcision, on trouvera lensemble de ces quations en
Annexe Mathmatique (1).
Calcul de la dispersion et des indicateurs de capabilit.
Pour calculer la dispersion de la distribution de la population, modlise par une courbe de Johnson,
on prend les p-quantiles de la loi normale rduite dlimitant 99.73% de la population, cest dire -3
et 3.
On applique une transformation qui permet alors de reporter les p-quantiles qui dlimitent la
dispersion sur la courbe de Johnson.
Trois transformations existent selon le type de loi choisi.
- Courbes non bornes
x=esinh
(
gz
h
)
- Courbes bornes x=e+
|
1+exp
(
gz
h
)

1
- Courbes Log-normales
x=e+exp
(
zg
h
)
Les indicateurs de capabilit se calculent en reprenant les formules utilises pour la mthode de
Clements. Johnson propose lui aussi de suivre la tendance centrale de la population laide de la
mdiane.
Critique des mthodes
Les diffrentes mthodes proposes dans ce paragraphe sont bases sur le principe dapproximation
de la distribution de la population par une famille de courbes paramtriques.
Pour estimer les paramtres de ces lois on distingue deux approches : lune base sur un calcul de
moments de la population tandis que lautre utilise une approximation de p-quantiles de la
population. Ces dernires sont, selon Farnum [Far 97]
36
, beaucoup plus fiables que celles utilisant
les moments. Cependant, il faut souligner que les mthodes utilisant les p-quantiles ne donnent des
rsultats vraiment fiables que pour des chantillons de taille respectable (de lordre de 100).
36
FARNUM R.N. Using Johnson curves to describe non-normal process data
Quality engineering 9(2) 329-336 - 1997
Bien que ces mthodes revtent un caractre gnral, elles nen sont pas moins limites par le type
de courbes quelles utilisent. En effet les courbes de Pearson ne peuvent dcrire que des
populations dont la distribution est unimodale. Les courbes de Burr en revanche permettent de
dcrire des distributions un peu plus complexes comme les lois multimodales. Cette proprit nous
semble particulirement intressante car bon nombre dapplications industrielles gnrent des lois
multimodales ; les couples de serrages par exemple [Gui 97]. Pour leur part, les lois de Johnson
prsentent la particularit de dcrire des lois dfinies sur un support born. Le cadre dapplication
nous semble ici moins vident mais on peut imaginer que des distributions soient tronques pour
des raisons physiques.
Les spcificits de chacune des mthodes proposes exigent donc que lutilisateur ait une petite
ide a priori de la distribution de la population.
Plusieurs auteurs comme Franklin et Wasserman se sont affranchis de ces problmes de
modlisation en proposant des mthodes non paramtriques.
Approches non paramtriques
Mthodes bootstrap
Les mthodes bootstrap ont une approche totalement diffrente de celles prsentes auparavant
puisque leur objectif nest pas de modliser au mieux la distribution de la population pour estimer
sa dispersion. Ce sont des mthodes destimation non paramtriques bases sur un
rchantillonnage de lchantillon original ncessaire lestimation des indicateurs de capabilit.
Les premiers travaux furent prsents par Efron B.[Efr 79]
37
, puis Efron & al [Efr 83] [Efr 86]
dvelopprent trois types dalgorithmes bootstrap. Ces mthodes, qui permettent de construire un
intervalle de confiance pour la statistique tudie, sont respectivement le bootstrap standard ou naf,
le bootstrap par les p-quantiles et le bootstrap biais corrig par les p-quantiles.
Ces diffrents algorithmes ont t tudis par Franklin L.A. & Wasserman G.S. [Fra 91]
38
[Fra 92]
39
pour la construction dintervalles de confiance pour les indicateurs de capabilit Cp Cpk et Cpm.
37
EFRON B. Bootstrap Methods :Another look at the Jackknife - Annals of Statistics - N7 - pp1-26 - 1979
38
FRANKLIN L.A.& WASSERMAN G.S. Bootstrap Confidence Interval estimates of Cpk : An introduction
Communications in Statistics - Simulation and Computation - N20 - pp231-242 - 1991
39
FRANKLIN L.A.& WASSERMAN G.S. - Bootsrap Lower confidence limits for capability Indices
Journal of Quality Technology Vol 24 N 4 - 1992
La mthode de calcul
On note
x
1
, x
2
, L , x
n
un chantillon de taille n prlev sur le procd pour calculer les indicateurs
de capabilit du procd. On appelle chantillon bootstrap, un chantillon
x
1
i
, x
2
i
, L , x
n
i constitu
par tirage avec remise dans lchantillon original. Il est possible de constituer n
n
chantillons,
partir dun chantillon original de taille n. Pour chacun des n
n
chantillons on calcule les
statistiques dintrt

C p*,

C pkou

C pmi
i
qui sont respectivement des estimateurs du Cp Cpk
ou Cpm.
Efron B conseille de prendre un minimum de 1000 chantillons bootstrap.
Lobjectif tant de dmontrer le bien fond de ces mthodes, nous nous contenterons den donner
un rapide aperu. Nous commenterons ensuite les rsultats obtenus par Franklin et Wasserman.
Le Bootstrap standard ou Naf
Lestimation dune statistique dintrt par la mthode bootstrap consiste dans la plupart des cas
calculer la moyenne des B ralisations de cette statistique (Eq 0). La statistique bootstrape, note

Ci
i
est indiffremment le Cp ou le Cpk.

Ci
1
B

i=1
B

C
( i )
i
i
Eq 0
On note S
c
* un estimateur de lcart type de lestimateur de lindice de capabilit

Ci
i

S
c
i
.
1
B1

i=1
B
(

C
( i )
i


C
i
)
2
Dans le cas dun intervalle de confiance bilatral (1-o) on calcule les limites par la relation
classique.

C!x
1 / 2
S
c
i
O et un p-quantile de la loi normale rduite pour la probabilit p=1-o/2.
Bootstrap par les p-quantiles
Cette deuxime mthode ne diffre de la premire que par le calcul de lintervalle de confiance. On
la construit partir des statistiques dordre de

Ci
i
correspondant aux p-quantiles o/2 et 1-o/2 (Eq
0).
|

C
( B( / 2) )
i
;

C
( B( 1/ 2) )
i

Eq 0
Cette mthode peut cependant souffrir de biais. Pour remdier ce problme, une seconde mthode
a t dveloppe. Il sagit du Bootstrap biais corrig par les p-quantiles.
Bootstrap biais corrig par les p-quantiles.
Pour dtecter un ventuel dcentrage de la distribution, on calcule partir des ralisations
ordonnes de

Ci
i
, la probabilit :
p
0
=P(

Ci c)
Cest dire le nombre de statistiques bootstrapes suprieures

Ci
i
, divis par B.
On calcule alors le p-quantile correspondant pour la loi normale rduite afin de dterminer les
probabilits associes chacune des limites de lintervalle de confiance.
x
0
=F
1
(
p
0
)

P
L
=F
(
2 x
0
x
1/ 2
)
P
U
=F
(
2 x
0
+x
1/ 2
)
do lintervalle de confiance (Eq 0)
|

C
(
P
L
B
)
i
;

C
(
P
U
B
)
i

Eq 0
Rsultats
Les travaux de Franklin et Wasserman ont mis en vidence que la mthode bootstrap nave tait la
plus prcise et la plus robuste la non normalit. En effet, les intervalles de confiance de 95%
construits partir dun chantillon de taille n=30, 50 ou 75 sont aussi performants que ceux
calculs dans le cas de la loi normale.
Au del du calcul dintervalle de confiance, on retiendra que lintrt des mthodes bootstrap est de
pouvoir fournir une estimation de bonne qualit dune statistique quand on a un nombre rduit
dobservations. Cela peut savrer intressant pour les indicateurs de capabilit ainsi que dautres
statistiques telles que des estimateurs de dispersion (S).
Ltude ralise par Franklin et Wasserman ne concerne que la robustesse des intervalles de
confiance la non normalit. On regrette en effet que les indicateurs Cp et Cpk utiliss soient ceux
dfinis dans le cas dune loi normale. La dispersion nest plus dans ce cas, conforme sa dfinition
sous lhypothse de normalit (99.73% de la population).
Les cartes de contrle
Le problme li lutilisation de cartes de contrle dans un contexte de non normalit, reste encore
relativement peu abord dans la littrature scientifique. La premire raison qui peut expliquer ce
phnomne est la relative robustesse des cartes de contrle la non normalit. En effet, lorsque la
population est faiblement dissymtrique, la moyenne, utilise pour estimer la position du procd,
reste distribue selon une loi normale. Cependant cette robustesse est trs limite du fait de la faible
taille des prlvements. De plus cette relative immunit la non normalit nest pas valable
pour les cartes aux valeurs individuelles ou encore pour les cartes utilisant dautres estimateurs que
la moyenne : la mdiane par exemple.
La seconde raison, qui peut expliquer ce manque denthousiasme pour ltude des cartes de
contrle dans une situation non normale, est la ressemblance du problme avec celui du calcul des
indicateurs de capabilit lorsque la population est non normale.
Une mthode pour calculer les limites de contrle dune carte

X , propose par Yourstone, utilise


dailleurs les courbes de Burr pour modliser la fonction de rpartition des moyennes. Des
mthodes quivalentes sont tout fait envisageables avec les courbes de Johnson ou Pearson.
Mthodes fondes sur une famille de lois
Construction dune carte partir des lois de Burr
Les cartes de contrle de type Shewhart sont construites en posant lhypothse de normalit de la
distribution des moyennes. Cette hypothse bien que trs forte, peut ne pas tre valable si la
population est fortement non normale. Dans ce cas, les limites de contrle places !3 s de la
cible ne garantissent plus des risques statistiques de lordre de 0.27%. Partant de ce constat,
Yourstone [You 92]
40
a propos une mthode de construction de carte de contrle base sur la
famille de lois de Burr. Lobjectif de cette mthode est de conserver le niveau de risque o proche de
0.27% quelle que soit la distribution de population.
Le problme de modlisation de la distribution de la moyenne pour fixer les limites de contrle, est
beaucoup moins complexe que dans le cas des capabilits car la distribution des moyennes bien
quoccasionnellement non normale possde une forte tendance centrale, et les distributions
considres sont dans la plupart des cas unimodales (sauf si les mesures dun chantillon ne sont
pas identiquement distribues).
Contrairement Castagliola qui construit la loi de Burr partir dune estimation des p-quantiles de
la population, Yourstone se base sur les moments.
40
YOURSTONE Steven A. & ZIMMER W.J. Non normality and the design of control charts for averages
Decision Science Vol 23 N5 pp 1099-1113 - 1992
Lorsque la distribution des moyennes ne peut tre modlise par une distribution normale, deux
alternatives se prsentent lutilisateur de cartes de contrle :
La premire solution consiste transformer les valeurs individuelles de telle manire que la
variable obtenue soit distribue selon une loi normale. Linconvnient dune telle mthode est li
la difficult de dterminer et de justifier la transformation approprie.
Une autre alternative consiste modifier les limites de contrle de la carte. Cette approche a
l'avantage de ne pas modifier les donnes de base. De plus, la modification des limites semble plus
simple effectuer et justifier. Une manire de modifier les limites est de procder au calcul des
probabilits. Cela requiert que l'on connaisse la forme de la distribution des moyennes ou qu'on
l'approche prcisment. Burr a dvelopp une fonction algbrique qui a la proprit de dcrire un
nombre important de distributions. Celle-ci peut-tre utilise pour dterminer les limites
dissymtriques de la carte.
La distribution de BURR
La distribution de BURR gnralise est utilise pour dterminer les limites non symtriques de la
carte de contrle. La fonction de rpartition de la distribution de BURR est dfinie par :
F
y
( y )=
|
1
1
( 1+y
c
)
k

y>0
F
y
( y )=0 y0

y donc est une variable alatoire dpendant deux paramtres positifs c et k.
Cas particuliers (Voir Figure 29) :
c = 4.85437 et k = 6.22665 dcrit une loi normale N(0 ; 1)
c = 3 et k = 6 dcrit une loi gamma de paramtre o=16
Fonctions de rpartition de Burr
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1 1.2
y
F
(
y
)
Loi Gamma Loi Normal
Figure 29
Dtermination des paramtres de la loi de Burr
Comme toute approche statistique, la construction dune carte de contrle ncessite une analyse
prliminaire du procd. On utilise un minimum de 50 valeurs individuelles pour dterminer

X
ainsi que les coefficients de Skewness et de Kurtosis (Eq 0) de la population.

3
=
1
N

i=1
N
(
X
i

X
)
3
|
1
N

i=1
N
(
X
i

X
)
2

3
2

4
=
1
N

i=1
N
(
X
i

X
)
4
|
1
N

i=1
N
(
X
i

X
)
2

2
Eq 0
Il est vident que deux distributions ayant les quatre premiers moments identiques ne sont pas
ncessairement identiques, cependant il est raisonnable de penser qu'il n'y aura pas de diffrence
dun point de vue pratique.
On dduit des quations (Eq 0) la valeur des coefficients de Skewness et de Kurtosis de la
distribution des moyennes [Sap 78]
41
.

3 X
=

3
n
1
2

4 X
=

4
3
n
+3
A partir des tables de BURR [Bur 67]
42
et des coefficients

3 X
et
4 X
, on dtermine les
coefficients c et k de la loi de Burr reprsentant la distribution de

X .
Dveloppement de la carte de contrle non symtrique
A partir du modle mathmatique que constitue la loi de Burr, on peut estimer la forme des queues
de la distribution de la moyenne, et donc calculer les limites de contrle assurant un certain niveau
de risque gauche et droite de la distribution.
La fonction de rpartition inverse dune distribution de Burr dfinie par la relation (Eq 0) :
Y =
|
( 1P)

1
k
1

1
c
Eq 0
est utilise pour dterminer les p-quantiles
x
0,00135
et x
0,99865
ncessaires au calcul des limites de
contrle.
41
SAPORTA G. Thorie et Mthodes de la Statistique - Technip - 1978
42
BURR, I. W. The effect of Non-Normality on constants for
X and R charts
Industrial Quality Control, Vol. 23, N11, pp563-568 Mai 1967
On note Y une variable alatoire distribue selon la loi de Burr caractrise par les coefficients k, c,
M et S. Les variables rduites de loi de Burr et de la distribution de la moyenne sont alors gales.
Y M
S
=

X m
s/ .n
et o tant respectivement la moyenne et lcart type de la population.
Do le changement de variable :

X =
s/ .n
S
( Y M )+m
Il suffit alors de substituer Y par les p-quantiles issus de la fonction de rpartition inverse dune
distribution de Burr (Eq 0) pour connatre les limites de la carte de contrle de type Shewhart (Eq
0).
LIC=m| M
(
( 1Pi )

1
k
1
)
1
c
i
s
S .n
LSC=m+|(
( 1Ps)

1
k
1
)
1
c
M
s
S .n
Eq 0
Conclusion
La dmarche propose par Yourstone prsente lavantage de fournir un cadre rigoureux pour la
dtermination des limites de contrle. Cet avantage est incontestable quand on sait que les limites
de contrle sont systmatiquement places 3o de lestimateur considr. Il faut aussi souligner
que cette mthode nexige pas un nombre excessif dobservations pour dterminer les limites de
contrle. Lauteur suggre en effet dutiliser au minimum 50 observations pour calculer les
coefficients de Kurtosis et de Skewness de la distribution de la moyenne.
Cependant comme le fait remarquer Rodriguez [Rod 92]
43
les mthodes bases sur les moments
peuvent donner des rsultats instables. Cest pourquoi il est trs hasardeux de vouloir trop rduire le
nombre dobservations.
Dautres approches sensiblement quivalentes sappuient sur une identification de la distribution de
la moyenne par la loi de Weibull ou Log-normale [Sch 96]
44
. On peut effectivement utiliser
dautres rseaux de courbes comme les lois de Pearson ou Johnson prsentes au paragraphe
prcdent, mme si lutilisation des courbes de Burr nous semble plus gnrale.
43
RODRIGUEZ R.N. Recent developments in process capability analysis
Journal of Quality Technology Vol 24 N 4 - 1992
44
SCHNEIDER H. KASPERSKI W.J. & al Control charts for skewed and censored data
Quality engineering 8(2):263-274 - 1996
Cas des populations stratifies
Mthodes d'chantillonnage
Parmi les procds permettant damliorer la prcision des estimations obtenues partir dun
chantillonnage alatoire, on peut retenir la technique de stratification [Gen 74]
45
[Ard 95]
46
. Ces
techniques concernent les populations non homognes dont on peut isoler les lois lmentaires
(Figure 30). La stratification, pralable lchantillonnage, consiste diviser la population en un
certain nombre de groupes homognes appels strates et tirer indpendamment un chantillon
dans chacune des strates.
St rat e
N 1
St rat e
N 3
St rat e
N 2
Figure 30
Lchantillon est alors constitu dautant de sous-chantillons quil y a de strates, chaque sous-
chantillon tant prlev au hasard dans une strate. De manire gnrale, on a toujours intrt
stratifier une population lorsque cela est possible.
Cette technique nest bien entendu possible que si les gnrateurs (ou strates) sont identifiables sur
le procd tudi. Pour des raisons conomiques videntes, les chantillons prlevs pour les cartes
de contrle, pour chacune des strates seront de petites tailles et le plus souvent unitaires.
Dfinition des strates
Le problme essentiel qui conditionne lefficacit de la mthode est le choix des strates et leur
dlimitation. Pour tre choisi comme critre de stratification, un caractre statistique quantitatif ou
qualitatif doit tre en corrlation troite avec les variables tudies. Pour un procd multi-
empreintes, par exemple, on applique la stratification par empreinte.
Lefficacit de la stratification dpend en effet de lhomognit des strates vis vis de ces
variables.
45
GENET J., PUPION G., REPUSSARD M. Probabilits, Statistiques et sondages - Vuibert - 1974
46
ARDILLY Les techniques de sondage - Technip - 1995
On peut montrer quon a intrt multiplier le nombre de strates pour accrotre la prcision de
lestimation. On reste nanmoins limit par la ncessit de tirer au moins un chantillon (mme
unitaire) par strate.
La stratification permet damliorer considrablement la prcision des estimations, dautant quil
est possible de dterminer une rpartition optimum des chantillons entre les diffrentes strates.
Dans le cas o le taux de sondage est uniforme entre les strates, lchantillon est appel chantillon
stratifi reprsentatif. Ce type dchantillonnage noffre pas un gain de prcision aussi important
que si le taux de sondage par classe est optimis.
Rpartition optimum de lchantillon entre les strates
Lobjectif de cet chantillonnage est de rpartir entre les diffrentes strates lchantillon, dont
leffectif global n est fix. Cette rpartition est faite de faon obtenir la meilleure estimation
possible.
Il sagit de dterminer les tailles n
1
, n
2
, ..., n
k
des chantillons dans les diffrentes strates, pour
lesquelles la variance de lestimateur est minimum avec la condition :

h=1
k
n
h
=n
Ceci revient rechercher le minimum de lexpression.
W( n
1
, . . . , n
k
)=V (

x ' )+
(

h=1
k
n
h
1
)
o est le multiplicateur de Lagrange
Pour obtenir la meilleure estimation possible, le taux de sondage dans chaque strate doit donc tre
proportionnel lcart-type dans la strate de la variable tudie.
La valeur du coefficient de proportionnalit est dtermin par la relation (Eq 0) :
K=
n

h=1
k
N
h
s
h
Eq 0
Cet chantillon est appel chantillon de Neyman.
Dun point de vu pratique, il semble difficile dappliquer un tel chantillonnage sur un procd de
fabrication. Cela voudrait supposer que la dispersion sur chacun des gnrateurs est parfaitement
connue et nvolue pas dans le temps.
Estimation de la moyenne de la population
Une fois lchantillonnage effectu dans chacune des strates, on peut estimer la moyenne de la
population en appliquant la relation (Eq 0).

x ' =
1
N

h=1
k
N
h
n
h

i=1
n
h
x
hi
Eq 0
avec
N leffectif total
N
h
leffectif de la strate h
n
h
la taille de lchantillon de la strate h
k nombre de strates
Dans le cas dun chantillon stratifi reprsentatif la relation se rsume la moyenne des
chantillons (Eq 0).

x ' =

h=1
k
N
h
N

1
N

i=1
n
h
x
hi
=
1
n

h=1
k

i =1
n
h
x
hi
Eq 0
avec
N
h
N

1
n
h
=
1
n
Variance de lestimateur de la moyenne
Lexpression gnrale de la variance de lestimateur de la moyenne de la population est donne par
la relation (Eq 0).
V (

x ' )=

h=1
k
N
h
2
N
2

N
h
n
h
N
h
1

s
h
2
n
h
=

h=1
k
N
h
2
N
2

N
h
n
h
N
h

S
h
n
h
Eq 0
avec
s
h
2
=
N
h
1
N
h
S
h
Exemple dapplication un procd mutignrateur
On peut montrer au travers dun exemple numrique quil est trs avantageux de prlever un
chantillon dans les strates dune population, plutt que de procd cet chantillonnage de
manire alatoire.
Prenons lexemple dun tour comportant 6 broches. Les 6 broches ont la mme dispersion o = 0.2 ;
lchantillon stratifi reprsentatif (1 pice par broche) est aussi lchantillon de Neyman
On suppose que les diffrentes strates ont respectivement pour moyenne 10.5 ; 10.1 ; 9.9 ; 10.2 ;
10.5 ; 10.0
La variance de la population sobtient partir des relations (Eq 0)
V | X =E | X
2
E | X
2
=p

i=1
k
(
s
i
2
+m
i
2
)

|
p

i=1
k
m
i

2
V | X =0 . 2
2
+
1
6
( 10. 5
2
+10. 1
2
+9 . 9
2
+10. 2
2
+10. 5
2
+10. 0
2
)10. 2
2
=0 . 0933
La variance de la moyenne dans le cas dun chantillonnage alatoire de taille n= 6 est donc :
V |

X =V | X / n=0 . 0155
En revanche si lestimateur est construit partir dun chantillon stratifi reprsentatif, sa variance
est donne par la relation :
n
h
= 1 h
o
h
= 0.2
N
h
=N/6 h
k= 6
dou V |

X ' =
1
36

h=1
k
s
h
2
=0 . 00666
Lefficacit relative de lestimateur construit sur un chantillon stratifi reprsentatif par rapport
la moyenne est donc :
V |

X '
V |

X
=
0 . 00666
0 . 01555
43
Aspect pratiques
Les mthodes de stratification sappliquent tout particulirement aux procds dont la production
peut tre dcompose en sous-groupes homognes. Pour les procds multignrateurs la
dcomposition est vidente puisque chaque gnrateur est lorigine dune loi lmentaire.
Pour un procd de type multibroches, on a tout intrt prlever une pice minimum par broche
(comme nous le montre lexemple ci-dessus), pour constituer lchantillon stratifi reprsentatif.
Cette mthode est nanmoins contraignante car elle oblige prlever des chantillons dont la taille
est multiple du nombre de gnrateurs. Si le procd possde un nombre important de gnrateurs
(machines transferts tables rotatives 18 postes) il devient difficile de procder la stratification de
la population pour des raisons conomiques. On lui prfre parfois lchantillonnage squentiel qui
consiste prendre un chantillon par strates conscutives [Pil 97a]
47
. Mme si on na pas un
chantillon minimum par strate, cette technique permet de rduire de manire significative la
variance des estimations de la moyenne. Dans le cas particulier o la taille dchantillon est gale
au nombre de gnrateurs, on a un chantillon stratifi reprsentatif.
On peut galement prlever systmatiquement les chantillons dans les mmes strates. Cela permet
de rduire la taille des chantillons, ou tout au moins de ne pas tre contraint prendre une taille
dchantillon gale au nombre de gnrateurs. Cette dmarche permet dobtenir une variance
infrieure celle dun chantillonnage squentiel mais a linconvnient majeur dtre biaise.
Cartes de contrle pour les populations stratifies
Lorsque lon rencontre une population stratifie, celle ci a trs souvent pour origine un procd
multignrateur. Le suivi de procds multignrateurs est assez complexe car il ncessite que lon
dtecte la fois les drives de lensemble du procd et les drives dun seul gnrateur.
Montgomery propose dans son ouvrage [Mon 91]
48
lutilisation de cartes de contrles spcifiques
pour le contrle statistique de ces procds.
Il propose dutiliser deux cartes de contrle pour effectuer le suivi dun procd multignrateur.
Lune pour la dtection de causes spciales qui affectent lensemble des gnrateurs, et lautre pour
les causes spciales qui noccasionnent le dcentrage que dun gnrateur ou un ensemble de
gnrateurs.
Pour dtecter un dcentrage du procd dans sa globalit, on prlve un chantillon de taille n par
gnrateur, la moyenne maxi et la moyenne mini sont reportes sur une carte de contrle. Si les
deux points sont sous contrle, cest qua fortiori les autres gnrateurs sont sous contrle. Les
limites de cette carte de contrle sont bases sur lcart-type de la moyenne des chantillons
prlevs sur chaque gnrateur.
47
PILLET M. DUCLOS E. Optimisation de la taille des chantillons dans le cas des systmes multignrateurs -
Revue Pratique de Contrle Industriel - N 203 - Fvrier 97
48
MONGOMERY Douglas C. Introduction to Statistical Quality Control - Wiley & Sons 2nd edition 1991
Pour dtecter la drive dun gnrateur par rapport aux autres gnrateurs, on reporte sur une
seconde carte quel est le gnrateur dont la moyenne est maxi ou mini. Si la moyenne des
chantillons sur un gnrateur est plusieurs fois conscutives suprieure ou infrieure celle des
autres gnrateurs, alors on peut considrer que ce gnrateur est hors contrle.
La priode oprationnelle (P.O.M.) de cette deuxime carte est donne par :
POM
1
=
g
r
1
g1
o g est le nombre de gnrateurs et r le nombre de fois conscutives ou un
gnrateur prend une valeur extrme.
X
LSC
LIC
Max
Min
1
1 3 3 7 7 7 7 7 2
6 5
2 4 5
6 5 3 6 5 5 5 1 6
Dtection de la drive du
gnrateur 7
S
max
ou
R
max
LSC=

X +3 s

X
LIC=

X 3 s
X
Un inconvnient majeur de ce type de carte est sa faible efficacit lorsque la variance globale du
procd est trs grande par rapport celle de chaque gnrateur.
En effet, si on considre
- Y
tj
une variable alatoire reprsentant les mesures sur un gnrateur j linstant t,
- la moyenne du procd ou la cible,
- A
t
une variable alatoire de moyenne nulle, et de variance o
a
2
qui reprsente la diffrence entre
les moyennes des gnrateurs linstant t et ,
- e
tj
une variable alatoire de moyenne nulle et de variance o
2
qui reprsente les variations du
gnrateur j linstant t.
Alors on peut modliser la moyenne dun chantillon de taille n, prlev sur un gnrateur par la
relation suivante :
Y
tj
=m+A
t
+e
tj
En consquence, la variance de la moyenne des chantillons prlevs sur un gnrateur est o
a
2
+o
2
/n
et les limites dune carte de contrle de Montgomery sont, dans ce cas, places
m!3
.
s
a
2
+s
2
/ n
. Si lon considre o
a
2
trs suprieur o
2
alors une volution de o
2
ne sera pas dtectable.
R.R. Mortell et G. C. Runger [Mor 95]
49
ont propos une alternative cette mthode en suivant
dautres variables. Deux cartes sont galement utilises pour suivre les procds multignrateurs.
Une carte de contrle pour dtecter les drives de lensemble des gnrateurs et une deuxime carte
pour dceler les drives dun gnrateur par rapport aux autres.
La premire carte est une simple carte de Shewhart sur laquelle on reporte la moyenne de
lensemble des gnrateurs. Les chantillons sont la plupart du temps unitaires sur chacun des
gnrateurs.
La seconde carte, utilise pour dtecter les drives dun gnrateur, est galement constitue dune
carte de type Shewhart ou CUSUM. Afin dliminer leffet des causes spciales sur lensemble des
gnrateurs, on soustrait la moyenne de chaque chantillon (prlev sur un gnrateur donn), la
moyenne des chantillons de lensemble des gnrateurs un instant donn. Ces grandeurs, aussi
appeles rsidus, sont insensibles lautocorrlation de A
t
et permettent par consquent de dissocier
les causes spciales qui influent sur un ou plusieurs gnrateurs, de celles qui agissent sur
lensemble des gnrateurs. Les limites de contrle dune telle carte sont places !3 s/ .n .
Une autre alternative pour dtecter dventuelles drives dun gnrateur est de suivre ltendue
entre la moyenne des chantillons prlevs sur chaque gnrateur un instant t.
Cette variable note
R
t
=max
j
(
Y
tj
)
min
j
(
Y
tj
)
peut tre suivie laide dune carte de Shewhart ou
une carte CUSUM. Cette procdure prsente lavantage sur la prcdente de ne reporter quune
seule variable sur la carte de contrle, quel que soit le nombre de gnrateurs du procd de
fabrication.
Conclusion
Le cadre dapplication des cartes de contrle de Mortell R. et de Montgomery D. sont les procds
multignrateurs pour lesquels la production dun gnrateur peut tre isole. Ces cartes prsentent
donc lintrt de fournir une information synthtique sur lvolution du procd. Elle permettent en
effet de dissocier les volutions communes lensemble des gnrateurs de celles limites un
gnrateur.
Cette approche multivarie ncessite donc que lon prlve au moins une observation par
gnrateur comme il a t suggr au paragraphe prcdent. Ceci entrane donc un cot lev de
prlvement.
49
MORTEL R.R. & RUNGE G.C. Startistical Process Control of Multiple Stream Process
Journal of Quality Technology Vol 27 N 1 - 1995
Une approche non paramtrique
Lestimateur de Hodges Lehmann
Ce nest que trs rcemment que lon sest intress aux mthodes destimations non paramtriques
pour les appliquer aux cartes de contrle.
Alloway et Raghavachi [All 91]
50
ont propos une carte de contrle utilisant lestimateur de
Hodges-Lehmann pour remplacer la carte

X . Lestimateur de Hodges-Lehmann possde la


caractristique essentielle doffrir une grande tolrance aux valeurs extrmes. De plus, il ne postule
aucune loi a priori.
Prsentation de lestimateur de Hodges-Lehmann
Nous nous plaons tout dabord dans le cas dun modle non paramtrique de localisation. On
considre une variable alatoire X telle que X-u a une fonction de rpartition F vrifiant F(0) = .
Le paramtre de localisation u est la mdiane.
Lestimateur de Hodges-Lehmann, associ aux statistiques de rang signes de Wilcoxon permet de
rsoudre le problme de test suivant :

H
0
: q=0
H
1
: q0
Sous lhypothse H
0,
la loi de lestimateur de Hodges-Lehmann est symtrique par rapport son
esprance.
On construit lestimateur de Hodges-Lehmann de la manire suivante :
- Pour chaque chantillon de taille n, on calcule les M=n(n+1)/2 moyennes de Walsh dfinies par :
W
i , j
=
X
i
+X
j
2
avec 1 i jn
- On ordonne les moyennes de Walsh :
W
( i ,1 )
W
( i ,2 )
LW
( i , M )
O W
(i,k)
est la statistique
dordre k des moyennes de Walsh ordonnes de lchantillon i.
Lestimateur de Hodges Lehmann est alors dfini par (Eq 0) :
q=md iane
(
W
( i ,1 )
, W
( i ,2 )
, L , W
( i , M )
)
Eq 0
50
ALLOWAY J. A. RAGHAVACHI M. Control charts based on the Hodges-Lehmann Estimator
Journal of Quality Technology - N23 - pp336-347 - 1991
Si M est impair q=W
(
i ,
M+1
2
)
Si M est pair
q=
W
(
i ,
M
2
)
+W
(
i ,
M
2
+1
)
2
Si la population est symtrique par rapport la mdiane u, alors q est distribu symtriquement
par rapport u. De plus
q est un estimateur non biais de u (quand les moments de X existent) et
quivariant par translation.
Les limites de contrle
Les limites de contrle de la carte de Hodges-Lehmann sont calcules exprimentalement partir
de m chantillons de taille n.
LIC=md iane
(
W
( 1, k )
, W
( 2, k )
, K , W
( m, k )
)
LSC=md iane
(
W
( 1, Mk+1 )
, W
( 2, Mk+1 )
, K , W
( m, Mk+1 )
)
Lordre k des moyennes de Walsh est dtermin laide de la relation suivante :
P
|
W
( i , k )
qW
( i , Mk+1 )

1
Cette relation fait appel aux statistiques de rang signes de Wilcoxon. Seul un nombre limit des
tests dhypothse sont ralisables puisque les statistiques de rang signes de Wilcoxon sont
discrtes. On trouve par exemple pour un chantillon de taille n= 8 et pour k=2 que lintervalle de
confiance est de 98.4%, ce qui semble tout fait acceptable pour une application SPC.
Les performances de la carte de contrle de Hodges-Lehmann
Alloway et Raghavachi ont mis en vidence que la taille dun chantillon ne devait pas tre
infrieure n=10 de manire obtenir des risques o de lordre de 0.27%.
Si on prend les moyennes de Walsh extrmes, pour un chantillon de taille 10, on montre que
99.8% de la population est entre les limites de la carte. Ainsi la Priode Oprationnelle Moyenne
thorique pour un procd centr (POM
0
=1/o) est de lordre de 500.
Les rsultats de simulation de E. Pappanastos & Adams [Pap 96]
51
montrent que les limites de la
carte de Hodges-Lehmann bases sur les distribution de Wilcoxon fournissent une POM
0
nettement
suprieure la POM thorique.
51
PAPPANASTOS E.A. & ADAMS B.M. Alternative Designs of Hodges-Lehmann Control Chart
Journal of Quality Technology Vol 28 N2 - 1996
Comparaison entre la carte de Shewhart et la carte de Hodges-Lehmann
On note d=
mm
0
s
le dcentrage du procd. Pappanastos & Adams ont compars la POM des
cartes de Shewhart et de Hodges-Lehmann pour diffrentes valeurs du dcentrage o et des
chantillons deffectif n=10.
o
0 0.25 0.50 0.75 1
POM

X 494.62 108.42 16.54 4.43 1.86
POM HL 20820.89 8317.32 7926.39 7710.20 7732.00
On peut conclure aisment en se rfrant au tableau ci-dessus que la carte de Hodges-Lehmann
nest absolument pas sensible aux dcentrages du procd.
Dautres mthodes de calcul des limites de contrle ont t proposes par E. Pappanastos. Il sagit
notamment de construire les limites de contrle partir dune quation de la forme :
q
i
!C2
i
.

S
2
.
o q
i
est la mdiane des estimations prcdentes
q
1
,
q
2
, ... ,
q
m
.

S
2
est la moyenne des variances des chantillons.
Le coefficient C2
*
est choisi pour fournir la POM
0
souhaite.
Cette alternative (HL*) permet de rendre la carte de contrle Hodges-Lehmann plus sensible aux
dcentrages du procd grce des limites de contrle plus resserres.
Malgr cet accroissement de sensibilit, la carte de contrle de Shewhart reste beaucoup plus
sensible que la carte de Hodges-Lehmann un dcentrage du procd. Ceci a pu tre constat pour
plusieurs types de distributions : loi normale, loi uniforme et double exponentielle (Figure 31).
o
0.00 0.25 0.50 0.75 1.00
Distribution normale

X 366.78 89.33 14.63 4.02 1.82


HL* 373 107.4 18.01 4.74 2.05
Distribution uniforme

X 198.79 48.60 9.00 2.95 1.58


HL* 158.37 56.56 13.48 4.49 2.07
Distribution double exponentielle

X 293.66 96.85 18.17 4.79 1.98


HL* 672.56 197.04 31.24 6.41 2.11
Figure 31
Critique des rsultats
Papanastos et Adams concluent la suite de ces rsultats que lutilisation de cartes de contrle
mettant en uvre lestimateur de Hodges-Lehmann pour un paramtre de localisation, nest
absolument pas viable.
Mme si leur conclusion peut savrer juste dans bon nombre de cas, il faut garder lesprit que
lestimateur de Hodges-Lehmann a une variance asymptotique infrieure celle de la moyenne
pour les lois tendance leptokurtique. Ce rsultat nest a priori pas surprenant car la mdiane a de
trs bonnes performances lorsque la distribution de la population est de nature leptokurtique.
Un thorme nonce dailleurs les proprits defficacit relative asymptotique de lestimateur de
Hodges-Lehmann pour les lois fortement unimodales [Cap 88].
0 . 864ERA( q ,

X )=
V (

X )
V ( q)
3
Lide de loi fortement unimodale est assez vague. Elle concerne en fait toutes les lois dont le poids
des queues est compris entre la loi uniforme U[-1,1] et la loi de Dirichlet De(0,1) selon le critre
de Van Zwet [Van 64]
52
. Ce critre permet de classifier les lois selon le poids de leurs queues.
Si lon interprte ce thorme, on saperoit que la variance de la moyenne est lgrement
infrieure celle de lestimateur de Hodges-Lehmann lorsque la loi est proche dune loi uniforme.
Au contraire celle-ci devient nettement suprieure quand la loi tend vers une loi de Dirichlet.
On retrouve ces rsultats en examinant les priodes oprationnelles des cartes

X et HL* de la
Figure 31. Les limites ayant t places systmatiquement !3 s/ .n , on peut constater que la
POM
0
de lestimateur de Hodges-Lehmann est plus faible que celle de la moyenne pour la loi
normale. La variance de lestimateur de Hodges-Lehmann est donc bien suprieure celle de la
moyenne. On note au contraire que la POM
0
est trs nettement suprieure lorsque lon est dans le
cas de la loi double exponentielle.
Lestimateur de Hodges-Lehmann nest donc pas si inintressant que Pappanastos le prtend. Il
suffirait dajuster convenablement les limites de contrle pour avoir une meilleure Priode
Oprationnelle Moyenne.
Un point important sur lequel les auteurs ne se sont pas tromps, concerne lapplicabilit de la carte
HL. En effet nous avons vu que les caractristiques de lestimateur de Hodges-Lehmann taient
particulirement intressantes pour des lois tendance leptokurtiques, mais quen revanche elles
taient mdiocres pour des lois platikurtiques.
En outre, on peut se demander si les objectifs viss ne sont pas contradictoires. En effet, en
appliquant lestimateur de Hodges-Lehmann la M.S.P, on cherche dtecter des volutions de la
population avec un estimateur qui se caractrise par une trs grande robustesse ; donc une faible
sensibilit aux volutions.
52
VAN ZWET W. R. Convex Transformations of Random Variables- Mathematisch Centrum - 1964
Calcul des limites partir des p-quantiles empiriques dun chantillon ordonn
Une autre approche propose par Willemain et Runger [Wil 96]
53
consiste construire les limites
dune carte de contrle en estimant les p-quantiles de la distribution de la variable reporte sur la
carte, partir dun chantillon ordonn. Cette mthode permet de construire un intervalle de
confiance indpendamment de la distribution des variables considres (Distribution-free tolerance
intervals) [Wil 62]
54
.
Les auteurs proposent dtudier m ralisations dune variable alatoire Y
i
, 1 im
Cette variable alatoire Y
i
est celle reporte sur la carte de contrle dont on cherche calculer les
limites ; cest aussi bien une observation individuelle que la moyenne ou ltendue dun
chantillon. Les Yi sont supposs indpendants et identiquement distribus.
Pour raliser le calcul des limites de contrle on supposera une priode dtude du procd,
prliminaire au pilotage. Lors de cette priode, le procd doit tre stable pour que les informations
collectes soient reprsentatives de la distribution de la population.
On note y(k) la statistique dordre k de lchantillon de taille m. Par convention
y
( 0 )
=- et y
( m+1 )
=+
Les m statistiques dordre divisent lespace des ralisations de Y en m+1 blocs statistiquement
quivalents .
y
(1)
y
(2)
y
(m-1)
y
(m)
....
y
Figure 32
On note P la probabilit quune ralisation de Y tombe entre les limites de lun de ces blocs (Eq 0).
P=Pr
|
y
( k )
Y y
( k+b)
=F
(
y
( k+b)
)
F
(
y
( k )
)
Eq 0
53
WILLEMAIN Th. R. & RUNGER G. C. Designing Control Charts using an Empirical Reference Distribution -
Journal of Quality Technology Vol 28 N1 - 1996
54
WILKS S.S. Mathematical statistics - Wiley 1962
Si on place les limites de manire empirique : LIC=Y
(k)
et LSC = Y
(k+b)
, b tant le nombre de blocs
entre les limites de contrle.
Alors P est la probabilit quun point soit plac entre les limites.
P est une variable alatoire distribue selon une loi beta de paramtres b et m (Eq 0).
g ( p)=
m!
( b1 ) ! ( mb) !
p
b1
( 1p)
mb
,0 p1
Eq 0
On note que g(p) ne dpend pas de f(y) qui est inconnue.
La probabilit quun point tombe entre deux limites a pour esprance et pour variance (Eq 0) :
E | P =
b
m+1

Var | P =
b( m+1b)
( m+1 )
2
( m+2 )
Eq 0
Analyse de la priode oprationnelle
On note R le nombre de tests avant dtection dun point hors contrle. R suit conditionnellement
P une loi gomtrique de paramtre 1-P telle que E(R/P=p)= 1/(1-p). La priode oprationnelle
moyenne est donc une variable alatoire dpendant de P.
Si on prend des limites de contrle LSC= y(k+b) et LIC= y(k) la distribution marginale de la POM
est une loi beta inverse (Eq 0) :
h( POM )=
C ( POM1 )
b1
POM
m+1
POM 1
Eq 0
Dont en dduit lesprance et la variance de la POM (Eq 0) :
E | E ( R/ P) =E | POM =
m
mb
et Var | POM =
bm
( mb)
2
( m1b)
Eq 0
On note quen choisissant des limites de manire obtenir la POM souhaite, cela ne signifie pas
que sa variance sera raisonnable. En effet, pour obtenir des limites avec un bonne prcision, il est
ncessaire de prlever un grand nombre dobservation dans la phase prliminaire, comme en
tmoigne la Figure 33.
m = nombre dobservation
b = nombre de blocs lintrieur
m b E(POM)
(POM)
741 73 370 370
8890 8866 370 77.1
184 830 184 331 370 16
Figure 33
Quelques restrictions sur la mthode :
Tout dabord, pour que E[POM] et Var[POM] soient finis, il faut que bm1 .
Par ailleurs, les auteurs prconisent de laisser au moins trois blocs de part et dautre des limites de
contrle pour obtenir des rsultats satisfaisants en terme de variance.
De plus, ils montrent quil faut prlever au moins 4.E[POM] observations, pour obtenir la POM
souhaite. Cependant, ceci ne garanti pas que la Variance de la POM sera raisonnable.
Ces diffrentes restrictions sur la mthode, la rendent difficilement applicable dans le domaine
industriel. En effet le nombre de donnes requises pour dterminer les limites de contrle est tout
fait rdhibitoire. On imagine mal un industriel attendre 50 000 mesures avant de pouvoir piloter son
procd.
La seule alternative consisterait ventuellement appliquer cette mthode sur les donnes dun
historique de production ou bien sur un procd pouvant fournir un volume important de donnes.
Dautre part cette mthode ne traite que les distributions symtriques puisque lon ne considre que
les paramtres b et m dans le calcul de la POM alors que le paramtre k a aussi beaucoup
dimportance.
Synthse
Les indicateurs de capabilit
Indicateurs de capabilit pour les procds non normaux
Les diffrents outils danalyse de capabilit prsents dans ce chapitre rpondent globalement assez
bien la demande industrielle dans la mesure o on considre quune pice est bonne quand on est
dans les tolrances. Cependant leur utilisation ncessite un minimum de prcautions pour obtenir
des rsultats cohrents. En effet, le pari qui consiste valuer la dispersion 99,73% de la
population est particulirement ambitieux, et chacune de ces mthodes possde un cadre
dapplication bien dfini, qui si on en sort, peut aboutir des rsultats bien diffrents de ceux
escompts.
Nous rsumerons les avantages et inconvnients de chacune des mthodes tudies sous forme dun
tableau (Figure 36).
Rflexion sur les indicateurs
Deux coles sopposent sur la dfinition des indicateurs de capabilit et notamment sur la dfinition
de la dispersion :
- La premire, dont nous venons dtudier les travaux adopte une approche qui consiste
considrer que la notion de capabilit est troitement lie celle de pourcentage hors tolrance.
On dfinit alors la dispersion sur un intervalle contenant 99,73% de la population.
- La seconde cole considre au contraire que la dispersion dfinie sur 6 cart-types de la globalit
des observations fournit une bien meilleure ide du niveau de qualit de la production.
Nous argumenterons et comparerons donc ces deux approches.
Dispersion 6
Prenons par exemple (Figure 34) le cas dune loi uniforme et dune loi normale dcart-types
unitaires avec une tolrance de 2. Pour chacune de ces lois, il est possible de calculer le ratio
IT/6o que nous associerons lindicateur Cp.
Dans ce cas, on constate quune distribution selon une loi normale engendre de lordre de 4.5% de
pices hors tolrances, ce qui se traduit par un Cpk trs faible, alors que dans le cas dune loi
uniforme aucune pice ne sort des spcifications.
On comprend aisment que pour le fournisseur, cette situation ne soit pas trs agrable. En effet,
malgr la conformit aux tolrances, le Cp et le Cpk sont infrieurs 1 et sa production risque
dtre refuse.
IT= 4
o=1
Cp= Cpk= 0.667
IT= 4
o=1
2.28% 2.28%

Figure 34
Du point de vue du client, le Cpk tant infrieur 1.33, il peut selon la norme en vigueur, refuser le
lot ou imposer le tri de la production. Le tri des pices distribues selon la loi normale permettra
damliorer le Cp. En revanche, celui de la loi uniforme, napportera aucune amlioration. Certains
constructeurs comme General Motors prconisent donc un tri de la population avec un calibre
resserr afin que la dispersion (6o) soit suffisamment faible pour garantir un bon Cp.
Ces mesures draconiennes, sont a priori peu conomiques car elle rebutent des pices qui sont dans
lintervalle de tolrance. Cependant lobjectif qui se rsume a fournir des pices dans les tolrances
nest pas suffisant pour garantir le niveau de qualit du produit fini. Il faut aussi que la production
soit centre sur la cote cible.
Dispersion sur 99,73% de la population
Considrons maintenant le cas o les indices de capabilit sont tablis en fonction de la lintervalle
couvrant 99,73% de la population (Figure 35).
IT= 4
Cp= Cpk= 1.33
IT= 4
Dispersion Dispersion

Figure 35
Pour le fournisseur, cette construction des indicateurs Cp et Cpk est beaucoup plus avantageuse. En
effet, une population uniforme a des Cp et Cpk identiques ceux dune loi normale ayant la mme
dispersion (99,73%). Or le cot de la non qualit au sens de Taguchi est beaucoup plus leve pour
la loi uniforme que pour la loi normale du fait de la faible concentration des observations autour de
la cible.
Il est vident dans ce cas, que le client se fait avoir sur la qualit de la marchandise.
Dautre part, on imagine mal un fournisseur appliquer cette mthode si la distribution de la
population suit une loi a tendance leptokurtique. Dans ce cas, en effet, un Cpk calcul en se basant
sur la dfinition de la dispersion 99,73% de la population, est infrieur un Cpk classique. Alors
pourquoi utiliser une mthode complexe et pnalisante ?
Conclusion
Selon nous, la variance ou lcart type offrent une dfinition de la dispersion beaucoup plus
cohrente et beaucoup plus rvlatrice de la qualit du produit que celle base sur les 99,73% de la
population. Les indicateurs de capabilits ainsi utiliss fournissent alors une information plus fidle
du niveau de qualit de la production.
Par ailleurs, nous pensons que la multiplication des mthodes de calcul des indicateurs de capabilit
est un vecteur de confusion pour les industriels dj confronts aux problmes de mthodologie de
la M.S.P.
Synthse des indicateurs de capabilit dans le cas de populations non normales
Type
dapplication
Mthode propose Avantages Inconvnients
Lois bornes
- Loi de dfaut de
forme
- Loi de Rayleigh
- Loi Log-normale
Facilit de mise en place. La validit du modle
ncessite une parfaite
connaissance du type de
critre tudi.
Lventail des
applications est limit.
Lois non
normales
unimodales
- Lois de Pearson
- Lois de Johnson
La mthode de
Clments est
particulirement simple.
Les courbes de
Johnson, offrent un plus
grand nombre de
possibilits, bien que plus
dlicates utiliser
La modlisation partir
de moments ou de p-
quantiles conduisent
parfois des rsultats peu
fiables. Il est donc
prfrable de prlever un
nombre important
dobservations.
Lois unimodales
et multimodales
continues
- Courbes de Burr
La construction des
courbes de Burr partir
de la fonction de
rpartition empirique de
la population permet de
dcrire des distributions
multimodales.
Le nombre
dobservations ncessaire
la modlisation de la
fonction de rpartition
empirique peut tre lev.
Lordre du polynme
peut avoir des
rpercussions importantes
sur la reprsentation de la
fonction de rpartition.
Modle non
paramtrique
- Mthode
Bootstrap
Estimations fiables pour
un nombre restreint
dobservations.
La construction dun
intervalle de confiance
permet dexclure les
estimations ponctuelles
aberrantes.
Les mthodes bootstrap
ncessitent des moyens
de calcul relativement
puissants.
Figure 36
Les cartes de contrle
La plupart des tudes portant sur la mise en uvre de cartes de contrle, dans le contexte de
procds non normaux, se focalisent sur le problme defficacit du test dhypothse. On retiendra,
au gr des publications, deux approches sensiblement quivalentes qui consistent, soit adapter les
limites de contrle au type de loi rencontr, soit transformer la variable reprsentant le procd
afin quelle soit distribue selon une loi normale.
Il faut cependant rappeler que les cartes de contrle ne se limitent pas une reprsentation
graphique de tests dhypothse. La carte de contrle est bien entendu un outil de prise de dcision
statistique, mais cest aussi un outil de rglage grce lestimation ponctuelle fournie par la
moyenne ou la mdiane. La non normalit de la population a aussi des rpercussions sur lefficacit
des estimateurs. Ce phnomne est dailleurs trs remarquable dans lapplication de la carte de
Hodges-Lehmann, qui est plus performante que la carte de Shewhart pour des populations de type
impulsionnelles.
Synthse des cartes de contrle dans le cas de populations non normales
Mthode Cadre dapplication Avantages Inconvnients
Dtermination des
limites de contrle en
modlisant la
population par une loi
de Burr
La moyenne des
chantillons suit une
loi non normale.
Mthode simple
Les limites calcules,
assurent un risque o
de lordre de 0,27%
Les mthodes se
basant sur les
moments ncessitent
souvent un volume
important de donnes.
Extraction des
tendances de la
population et des
gnrateurs extrmes
Procds
multignrateurs
Lchantillonnage
stratifi reprsentatif
fournit une estimation
dont la variance est
proche de la variance
optimale.
Il faut pouvoir isoler
la production de
chacun des
gnrateurs
Estimateur de
Hodges-Lehmann
Toute loi non normale
satisfaisant le modle
non paramtrique de
localisation.
Modle non
paramtrique
Estimateur plus
performant que la
moyenne pour les lois
leptokurtiques
La robustesse de cet
estimateur est au
dpend de sa
sensibilit. Ce qui se
caractrise par une
POM mdiocre.
Calcul des limites par
les p-quantiles
Toute loi Mthode utilisable sur
les ralisations de
nimporte quelle
variable alatoire.
Le nombre
dchantillon
ncessaire pour
obtenir des limites de
contrle fiables est
exorbitant
Figure 37
Conclusion
Laspect applicatif est de loin le plus important pour la M.S.P. On regrette donc que certaines
mthodes soient proposes sans tenir compte des ralits industrielles. On citera par exemple la
mthode non paramtrique de calcul des limites de contrle partir des p-quantiles empiriques dun
chantillon ordonn. Pour que les limites puissent assurer une P.O.M. de 370 par exemple, la
mthode propose requiert 1500 chantillons. Etant donn la tendance est au raccourcissement des
sries, bon nombre dentre elles seraient termines avant que les limites de la carte de contrle ne
soient tablies !
Laspect applicatif concerne galement le nombre dobservations au sein dun chantillon. En effet,
la taille dun chantillon revt une importance conomique et pratique qui peut prvaloir par
rapport loptimalit des estimations en terme de variance. Dans le cas de procds
multignrateurs par exemple, nous savons que la variance des estimations est minimale si lon
prlve un chantillon de Neyman. Mais peut-on srieusement penser quun industriel prlvera au
moins une pice sur chacune des 12 empreintes d'une presse ? Cest en effet illusoire.
Il serait donc particulirement intressant dexplorer des mthodes non paramtriques permettant
doffrir des estimations dont la variance est infrieure celle de la moyenne quelle que soit la
distribution des observations. Il serait aussi important que la carte de contrle mise en uvre, ne
limite pas son application un type dchantillonnage particulier.
Chapitre 3
Chapitre 3
Mise en place dune carte de contrle pour
les procds non normaux.
Introduction
La non normalit est un problme important pour lapplication de la Matrise Statistique des
Procds, cest pourquoi ce sujet a t assez largement abord ces dernires annes.
Les approches utilises pour aborder ce problme sont le plus souvent assez classiques car elles
consistent adapter les mthodes de la Matrise Statistique des Procds certains types de non
normalits. Ainsi, laccent est particulirement port sur le calcul des limites de contrle des cartes,
en vue dune amlioration de la Priode Oprationnelle Moyenne.
En revanche, on sintresse assez peu aux performances des estimateurs utiliss. Ainsi on utilise
assez systmatiquement la moyenne ou la mdiane comme estimateur ponctuel de la position du
procd. Mais peut-on rellement envisager doptimiser la P.O.M. dune carte de contrle, sans
sinterroger sur les performances de ces estimateurs ponctuels ?
Les caractristiques essentielles dun estimateur sont sa justesse et sa prcision. Or nous savons que
lun des inconvnients majeurs des mthodes paramtriques, est de voir leurs performances chuter
lorsque les conditions exprimentales sloignent du modle statistique utilis (la loi normale par
exemple). Ainsi la moyenne est lestimateur optimal en terme de variance lorsque la population suit
une loi normale. En revanche la mdiane a de bonnes performances pour des lois tendance
leptokurtiques ou impulsionnelles (Chapitre 2 1.3.3).
Le second lment prendre en considration est le choix des paramtres de localisation et
dchelle de la population. Comment justifier le choix de la mdiane plutt que celui de la
moyenne ? Nous verrons quil est possible de justifier ce choix en considrant le cot de la non
qualit au sens de Taguchi.
Tout au long de nos travaux, nous avons tent de rsoudre les diffrents problmes lis
loptimalit de lestimateur ponctuel, le choix des paramtres de la population, afin de mettre en
uvre une mthode gnrale indpendante du caractre de la population.
Nous proposons dans ce chapitre une nouvelle approche pour la mise en place de la M.S.P. dans le
cas de procds non normaux. Loriginalit du concept que nous proposons, repose essentiellement
sur une approche non paramtrique de lestimation de paramtres de la population. La carte de
contrle que nous prsentons a lavantage dtre plus prcise et plus sensible aux dcentrages du
procd, que des cartes utilisant la moyenne.
- Dans un premier temps, nous ferons quelques rappels sur la notion de statistiques dordre et plus
particulirement sur les combinaisons linaires de statistiques dordre ou L-statistiques. Aprs
avoir prsent le L-estimateur des moindres carrs, nous tudierons certaines de ses proprits
afin de montrer son adquation au problme destimation auquel nous sommes confronts.
- Dans un second temps nous dfinirons plusieurs mthodes de mise en place de la carte L
(construite partir du L-estimateur des moindres carrs) selon la richesse de linformation dont
on dispose. Nous dterminerons galement le choix des paramtres de la population, en se basant
sur le critre de la perte au sens de Taguchi.
- Enfin nous comparerons les performances de la carte L celles de cartes de contrle utilisant la
moyenne comme estimateur ponctuel.
Statistiques dordre et L-estimateurs
Les statistiques dordre ont jou un rle prpondrant dans le dveloppement de mthodes robustes
et non paramtriques. On les rencontre de faon assez naturelle et depuis longtemps dans les
problmes de rejet de valeurs extrmes, grce des estimateurs tels que les moyennes o tronques.
Nous commencerons, dans ce chapitre, par donner les dfinitions et quelques proprits des
statistiques dordre, puis nous tudierons les lois exactes et asymptotiques des statistiques dordre
et enfin leurs combinaisons linaires (L-statistiques).
Lobjectif de ce paragraphe est de rappeler en quelques lignes les rsultats fondamentaux
communment admis. Pour plus de prcisions nous invitons le lecteur se reporter aux ouvrages de
J. P. Lecoutre [Lec 87]
55
P. Capra & B. Van Cutsem [Cap 88]
56
ou encore H. David [Dav 81]
57
.
Introduction aux statistiques dordre
Les statistiques dordre
Soient des variables
x
1
, x
2
, K , x
n
que lon range dans lordre croissant et que lon note
x
(1 )
x
( 2 )
Lx
( n)
. La variable alatoire X
(i)
associe toute ralisation
x
1
, x
2
, K , x
n
est la i
me
plus petite valeur de lchantillon. Cette variable est appele statistique dordre i (i = 1, 2, ...n).
Le sujet des statistiques dordre est trs vaste car il concerne toutes les fonctions de variables
alatoires ordonnes. Un exemple trs classique de telles fonctions est ltendue
R=x
( n)
x
( 1 )
trs
largement utilise pour donner une estimation rapide de la dispersion dune population. Une autre
fonction bien connue des utilisateurs de la M.S.P, est la mdiane
x=x
(
n
2
+1
)
avec n impair, qui
fournit une estimation robuste de la position de la population.
55
LECOUTRE J.P. & TASSI P. Statistique non Paramtrique et Robustesse - Economica - 1987
56
CAPERAA Ph & VAN CUTSEM B Mthodes et modles en statistiques non paramtriques Expos fondamental
- Presse de l'universit Laval - DUNOD - 1988
57
DAVID H. A. Order Statistics - New York - Willey - 1981
Lois de probabilit associes une statistique dordre
On note F(x) la fonction de rpartition de la variable alatoire X et f(x) sa densit de probabilit. La
fonction de rpartition de la statistique dordre X
(s)
est note F
s
(x) et sa densit de probabilit
(marginale) f
s
(x) (Eq 0).
f
s
( x )=
1
( s1 ) ! ( ns) !
F
s1
( x ) | 1F ( x )
ns
f ( x)
Eq 0
Cette expression de f
s
(x) peut permettre dtablir la loi de distribution de la mdiane si on connat la
fonction de rpartition des observations x.
La densit jointe de deux statistiques dordre X
(i)
et X
(j)
est donne par la relation (Eq 0).
f
ij
( x , y)=
n!
( i1 ) ! ( j i1 ) ! ( n j ) !
F
i1
( x)f ( x) | F ( y)F ( x)
ji1
f ( y) | 1F ( y)
n j
Eq 0
A partir de la densit jointe de deux statistiques dordre, on peut tablir la densit de probabilit de
statistiques dordre telles que ltendue. On trouvera dans lannexe mathmatique le
dveloppement de ce calcul pour une population distribue selon une loi uniforme.
Moments des statistiques dordre
Nous avons vu dans la section prcdente quil est difficile dexprimer les lois marginales des
statistiques dordre au moyen de fonctions lmentaires. Il en est de mme pour les moments exacts
de ces statistiques.
Si une variable X possde un moment dordre k, alors pour tout r e {1, ... ,n}, la r
me
statistique
dordre X
(r )
possde un moment dordre k. Ce moment sexprime par la relation (Eq 0).
E
|
X
( r )
k

=
n!
( r1 ) ! ( nr ) !

x
k
F
r1
( x) ( 1F ( x ) )
nr
dF ( x)
Eq 0
Les conditions dexistence de la covariance de deux statistiques dordre sont sensiblement
quivalentes celles des moments dordre k. En effet, si lesprance E[X] de la variable X existe
alors, pour tout couple (r, s) tel que 1 rsn ,
E
|
X
( r )
X
( s)
existe (Eq 0).
E
|
X
( r )
X
( s)
=
n!
( r1 ) ! ( sr1 ) ! ( ns) !

xy
xyF
r1
( x)( 1F ( x) )
nr
dF ( x)
Eq 0
Les L-statistiques
Les exemples de la mdiane ou encore de ltendue suggrent la gnralisation de lutilisation de
combinaisons linaires des composantes du vecteur des statistiques dordre.
Soient X
1
, X
2
, ... , X
n
un chantillon dune loi F et

X le vecteur des statistiques dordre associ.


Soient c
1
, c
2
, ... , c
n
n coefficients rels. On appelle L-statistique, la statistique T
n
dfinie par (Eq 0).
T
n
=

i=1
n
c
i
X
( i )
Eq 0
Les L-statistiques peuvent tre utilises pour estimer les paramtres de localisation ou de dispersion
dune loi parente. On les appelle alors L-estimateurs.
Loi asymptotique des L-statistiques
La loi exacte dune L-statistique est souvent trs dlicate tablir du fait de la complexit des
calculs. On ne trouve dans la littrature que quelques dmonstrations concernant des lois parentes
relativement simples telles que la loi uniforme ou encore la loi exponentielle. Seuls les premiers
moments peuvent tre calculs ou approxims aisment. On peut en revanche obtenir des rsultats
de manire plus aise en considrant la loi asymptotique des L-statistiques. Mme si dans le cadre
dapplication de la M.S.P. nous sommes bien loin des conditions asymptotiques (puisque n est
relativement petit en M.S.P.) nous pouvons nous intresser ces proprits pour les tests par
intervalle de confiance. Rappelons ce titre que la distribution de la moyenne empirique

X est
souvent suppose suivre une loi normale pour tablir les limites dune carte de contrle alors
quelle nest quasymptotiquement normale.
Comme les valeurs centrales et les valeurs extrmes des statistiques dordre nont pas les mmes
lois asymptotiques, les lois limites obtenues pour une L-statistique seront trs diffrentes selon les
poids (coefficient c
i
de la L-statistique) attribus chacune des statistiques dordre.
Pour obtenir une loi limite qui soit une loi normale, les coefficients extrmes c
1
et c
n
ne doivent pas
tre trop grand. En effet, un thorme dvelopp dans David [Dav 81] nonce quune condition
suffisante pour que la distribution dun L-estimateur soit normale, est quun poids nul soit donn
aux valeurs extrmes.
En fait, les conditions pour que la distribution dun L-estimateur soit asymptotiquement normale
porte la fois sur la loi parente, la valeur des coefficients de la L-statistique et le nombre de ses
coefficients. Une version simplifie du thorme de Shorack [Sho 1972]
58
est nonc dans
louvrage de Capra [Cap 88]. Les hypothses postules par Shorack concernent le comportement
de la fonction de poids (poids affect chacune des statistiques dordre) pour les valeurs extrmes
ainsi que lvolution de la fonction de rpartition de la population pour les valeurs excentres. Il
montre la dualit entre deux critres.
- Plus la fonction de rpartition F converge lentement vers 0 et 1, plus les contraintes sur la
fonction de poids sont fortes. Il faut en effet que les poids affects aux statistiques dordre
extrmes soit nuls, comme la nonc David.
- Dans le cas contraire, si les coefficients affects aux statistiques dordre extrmes sont non nuls
(la moyenne empirique par exemple), les contraintes sur la fonction de rpartition sont plus
fortes pour que lon puisse conclure la normalit asymptotique du L-estimateur.
Fonction de rpartition de la
population
Fonction de poids Conditions de
normalit
F
(
x
)
x
1
0
Tendance
Platikurtique
J
(
u
)
u 0
1
Si la fonction de poids
est non nulle en 0 et 1,
il est ncessaire (et pas
forcment suffisant)
que la fonction de
rpartition converge
rapidement vers 0 et 1.
F
(
x
)
x
0
1
Tendance
Leptokurtique
J
(
u
)
u
1 0
Si la fonction de
rpartition converge
lentement vers 0 et 1, il
est ncessaire que la
fonction de poids soit
nulle en 0 et 1.
Cette dernire affirmation montre que la moyenne et les L-estimateurs (si les coefficients sont non
nuls aux extrmes) sont soumis aux mmes conditions quant leur distribution asymptotique. Nous
verrons donc un peu plus loin comment envisager le calcul des limites de contrle dune carte
utilisant un L-estimateur.
58
SHORACK G.R. Functions of order statistics - Ann. Math. Statist - N 43 pp 412-427 - 1972
Robustesse des L-statistiques
Une statistique est dite robuste, si linfluence des valeurs extrmes est limite et varie continment.
Ainsi, les images de deux lois proches, par une statistique robuste, restent proches.
Pour tudier la robustesse dune statistique, on introduira la notion de fonctionnelle statistique.
Soit u une fonction paramtrique et P une loi de probabilit ; alors T est une fonctionnelle telle que
q=T ( P) .
Une dfinition importante de la robustesse, propose par P Huber [Hub 64]
59
et F Hampel
[Ham 68]
60
repose sur la continuit de la fonctionnelle T au voisinage de la fonction P.
Nous donnerons les rsultats qui proviennent de cette dfinition pour les L-statistiques sans rentrer
dans les dtails mathmatiques.
On suppose que la fonctionnelle dune L-statistique est dfinie par la relation
T ( P)=

0
1
P
1
( u)J ( u)du
o J est la fonction de poids des coefficients dfinie sur le support [0,1].
On voit alors que les critres pour que la fonctionnelle T soit continue sont ceux noncs au
paragraphe prcdent : Pour que la statistique T
n
soit robuste, il faut
- soit que la fonction de poids soit nulle lextrieur du support [o,1-o],
- soit que la loi P converge rapidement vers 0 et 1.
La normalit de la distribution dune L-statistique et sa robustesse sont donc troitement lies.
Des tudes de robustesse menes par Hampel [Ham 74] concernant des estimateurs trs classiques
comme la moyenne empirique, la mdiane empirique, les moyennes o tronques ou encore
lestimateur de Hodges-Lehmann, ont mis en vidence que seule la moyenne parmi ces estimateurs
possde une fonctionnelle non continue. Cette non robustesse se traduit alors par une tolrance
nulle aux valeurs extrmes. En effet le coefficient de tolrance de la moyenne est nul, ce qui
signifie toute valeur aberrante une rpercussion sur lestimation. En revanche, un estimateur trs
robuste comme la mdiane a un point de rupture asymptotique de 0,5 (Voir chapitre 1).
59
HUBER P. Robuste estimation of a location parameter - Ann. Math. Statist. N35 - pp 73-101
60
HAMPEL F. R. The Influence curve and its in robust estimation J. Amer. Statist. Assoc. -
N69 pp 383-393 - 1974
Proposition dun autre estimateur pour les cartes
de contrle
Choix de lestimateur
Le choix dun estimateur est souvent un problme complexe qui oblige des compromis. De
nombreux critres, parfois contradictoires, sont prendre en compte.
Notre choix sest donc articul autour de trois critres essentiels :
- Nous souhaitions tout dabord que la mthode utilise soit non paramtrique afin de ne pas
restreindre notre domaine dapplication une famille de lois statistiques. En effet, la majorit
des mthodes de la Matrise Statistique des Procds aborde les problmes dun point de vue
paramtrique, ce qui selon nous, est un procd rducteur et pnalisant. On suppose que la
distribution des observations peut tre caractrise par une loi ou une famille de lois. Cette
famille est elle-mme fonction dun nombre restreint de paramtres, comme la moyenne et
lcart-type pour une loi normale. La simplicit des mthodes paramtriques rside
essentiellement dans le nombre restreint de paramtres estimer pour caractriser la loi. Une
telle approche peut tre parfaitement adapte si la famille de lois est lie certaines
caractristiques physiques du procd. Cependant, le choix dun modle paramtrique comme la
loi normale, bien que valide dans bon nombre de cas, ne peut raisonnablement satisfaire tous les
cas de figure.
- Dautre part, lobjectif tant de remplacer la moyenne par un autre estimateur, celui-ci se doit
dtre sans biais et avec une variance infrieure ou gale celle de la moyenne. La moyenne
ntant pas toujours le meilleur estimateur, en terme de variance, lorsque la distribution de la
population est non normale, il est possible de trouver un estimateur dont la variance sera plus
faible quelle que soit la distribution des observations. Ces conditions sont en effet indispensables
pour que la carte de contrle mise en oeuvre dtecte des causes spciales au moins aussi
rapidement quune carte de Shewhart.
- Enfin, pour que la mthode propose possde un caractre gnral, il est important que
lestimateur utilis converge vers la moyenne dans les cas ou la population est distribue selon
une loi normale.
Le L-estimateur des moindres carrs
Prsentation
L'estimateur que nous allons utiliser sapplique un trs grand nombre de distributions,
pour ne pas dire toutes, puisquil sagit de distributions qui ne dpendent que d'un paramtre de
position et d'un paramtre d'chelle, quelles que soient leurs formes.
Pour de telles distributions, Lloyd [Llo 52]
61
montre que les paramtres peuvent tre estims en
appliquant la thorie des moindres carrs gnraliss un chantillon ordonn.
Ces estimateurs, qui sont des combinaisons linaires des observations ordonnes, ont la proprit
trs intressante d'tre la fois sans biais et variance minimale. En effet, la variance de
l'estimateur de la position de Lloyd nexcde jamais la variance de la moyenne.
La construction de cet estimateur se base sur une modlisation de la distribution empirique ou
thorique de la population.
Estimation par les moindres carrs
Dans ce paragraphe nous donnons une rapide dmonstration de la construction du L-estimateur des
moindres carrs. Pour plus de dtails nous invitons le lecteur se reporter lannexe mathmatique
(Annexe 2)
Nous appelons et o respectivement les paramtres de position et d'chelle de la distribution de la
fonction. Ces paramtres, que lon cherche estimer par la mthode des moindres carrs, ne sont
pas ncessairement la moyenne et l'cart type de la population.
On note (x
(1)
,x
(2)
,...,x
(n)
) les observations ordonnes du vecteur X
k
telles que
x
(1 )
x
( 2 )
Lx
( n)
Nous allons construire la variable rduite U
(r)
de rang r, telle que :
U
( r )
=
(
x
( r )
m
)
s
Les moments dordre 1 et 2 de la variable U sont alors nots
E
|
U
( r )

=
r
Var
|
U
( r )

=w
rr
Cov
|
U
( r )
, U
( s)

=w
rs
On crit l'expression de l'esprance des statistiques d'ordre x
(r)
sous forme vectorielle
E | X =me+s
61
LLOYD E. H. Least-Squares Estimation of Location and Scale parameters Using Order Statistics - Biometrika -
Vol 39 - pp 88-95 - 1952
o
est le vecteur des o
r
e est un vecteur ayant des composantes unitaires
X est le vecteur des mesures ordonnes
que lon note respectivement
=
(

1
M

n
)
e=
(
1
M
1
)
et X =
(
x( 1 )
M
x( n)
)
Lexpression de lesprance des statistiques dordre peut se simplifier sous la forme
E | X =Aq
o
q=
(
m
s
)
A=
|
1
1
M M
1
n

La matrice de covariance de X est donne par : COV ( X )=s


2
D
O est une matrice (nxn) des lments
w
rs
Le modle tant un modle linaire multiple ordinaire de la forme E | X =Aq , on connat une
estimation du vecteur u au sens des moindres carrs gnraliss, donne par la relation (Eq 0) :
q=( A
t
D
1
A)
1
A
t
D
1
X
Eq 0
La variance des estimateurs est donne par :
Var | m=s
2

t
D
det ( A
t
D
1
A)
Var | s =s
2

e
t
De
det ( A
t
D
1
A)
Ce qui permet de comparer aisment les performances de la moyenne celle du L-estimateur de
position.
Dautres auteurs comme Downton [Dow 54] ont tudi les performances du L-estimateur des
moindres carrs pour des distributions classiques telles que la loi uniforme, une loi triangulaire
tronque, la loi exponentielle et une loi de Pearson de type III. Il confirme que la variance du L-
estimateur de Lloyd est infrieure celle de la moyenne pour la loi uniforme et la loi triangulaire.
De plus, il montre que lestimateur des moindres carrs est la moyenne pour la loi exponentielle, ce
qui tait prvisible puisque la moyenne est dans ce cas lestimateur sans biais variance minimale.
Cas particulier des distributions symtriques
Lloyd a galement dtaill le cas o la loi parente est symtrique. Il montre que les estimateurs de
localisation et de dispersion sont respectivement donns par les quations Eq 0 et Eq 0.
m=
e
t
D
1
X
e
t
D
1
e
Eq 0
s=

t
D
1
X

t
D
1

Eq 0
La variance des estimateurs est donne par les relations Eq 0 et Eq 0 :
Var ( m)=
s
2
e
t
D
1
e
Eq 0
Var ( s)=
s
2

t
D
1

Eq 0
Cet estimateur a trouv une de ses premires applications en traitement dimage. Bovik [Bov 83]
propose en effet une application de filtrage o limage, reprsentant un signal informatif s, est
entache dun bruit blanc additif b.
X
j
=s+b
j
La loi de distribution du bruit est suppose symtrique.
Pour supprimer les effets du bruit, Bovik cherche le L-estimateur qui minimise lerreur quadratique
moyenne E ( ss) .
Nous ne dvelopperons pas ici le calcul des coefficients du L-estimateur de position, celui-ci est
nanmoins disponible dans lannexe mathmatique (Annexe2 3)
Les coefficients optimaux au sens de lerreur quadratique moyenne sont donns par la relation Eq
0.
C=
H
1
e
e
t
H
1
e
Eq 0
ou H est la matrice des coefficients
H
ij
=E
|
b
( i )
b
( j )
Etude qualitative du L-estimateur
Les rsultats prsents par Bovik sont assez loquents, quant aux amliorations apportes par le L-
estimateur des moindres carrs dans le cadre dune population non normale. Les performances du
L-estimateurs peuvent se rsumer un calcul de lefficacit relative par rapport la moyenne et la
mdiane pour diffrents types de distributions (Figure 38). Leffectif des chantillons est n=3.
Distribution
Var(L-estimateur)/Var(Mdiane) Var(L-estimateur)/Var(Moyenne)
Forme en U 0.306 0.749
Uniforme 0.500 0.900
Parabolique 0.603 0.963
Triangulaire 0.667 0.988
Normale 0.742 1.000
Laplace 0.900 0.862
Figure 38
Lefficacit du L-estimateur est dautant plus grande par rapport la moyenne que la loi diffre de
la loi normale. Les variances sont les mmes pour une loi normale et lamlioration nest que
substantielle pour une loi triangulaire.
En revanche, les progrs par rapport la mdiane sont dautant plus grands que les queues de la
distribution sont lgres. Ainsi les rsultats sont trs satisfaisants pour une loi uniforme et le sont
beaucoup moins pour une loi tendance centrale trs prononce comme la loi de Laplace.
Calcul du L-estimateur par la mthode de Lloyd
Le calcul formel des coefficients dun L-estimateur est relativement pnible car il faut tablir
plusieurs moments caractristiques des statistiques tudies. Ainsi, si on utilise la mthode
propose par Lloyd on calcule la matrice de covariance des statistiques d'ordre rduites 8 ainsi que
le vecteur des esprances des statistiques d'ordre . Pour la mthode de Bovik, on dtermine la
matrice H.
Nous donnerons titre dexemple le dveloppement du calcul pour une loi uniforme. Pour des
distributions plus complexes nous aurons recours au calcul numrique par ordinateur.
Supposons que la variable alatoire X soit distribue selon une loi uniforme U sur l'intervalle [0,1].
Sa densit est f(x)=1 et sa fonction de rpartition F(x)=x sur ce mme intervalle (Figure 39).
f
(
x
)
x
F
(
x
)
x
0 1
1
1
1 0
Figure 39
Lexpression de lesprance dune statistique dordre se simplifie dans le cas de la loi uniforme
E
|
X
( k )

=n. C
n1
k1
.

-
+
X
k
. ( 1F ( X ))
nk
. f ( x ). dx
i n. C
n1
k1
.

0
1
x
k
. ( 1x)
nk
. dx
Cette intgrale est de la forme gnrale I =

a
b
( xa)
m1
( bx)
m2
dx
d'o sa solution I b a
m m
m m
m m
=
+ +
+ +
( )
! !
1 2 1
1 2
1 2 1
avec ici b=1 a=0 m1=k m2=n-k
d'o E
|
X
( k )

=n
( n1 ) !
( k 1 ) ! ( nk ) !

k ! ( nk )!
( n+1 )!
=
k
n+1
On en dduit E[X
(k)
X
(l)
] ainsi que la variance de X
k
et la covariance de X
k
et X
l
.
Var
|
X
( k )

=
k ( nk+1 )
( n+1 )
2
( n+2 )
Cov
|
X
( k )
, X
( l )

=
k ( nl +1 )
( n+1 )
2
( n+2 )
avec1 kl n
Il est alors possible de construire la matrice O et la matrice H. Le calcul des coefficients du L-
estimateur tant particulirement dlicat dans le cas gnral d'un chantillon de taille n, nous nous
contenterons de traiter l'exemple n=3.
D=
1
80

|
3 2 1
2 4 2
1 2 3

On inverse les matrices de covariance O
D
1
=20
|
2 1 0
1 2 1
0 1 2

En utilisant la relation (Eq 0) de Lloyd, on trouve que le L-estimateur optimal est le filtre milieu. Il
est optimal en terme de variance parmi les estimateurs linaires.
C
opt
=
(
1
2
0
1
2
)
Calcul du L-estimateur par la mthode de Bovik
La mthode propose par Bovik suppose que le bruit soit centr. Cest pourquoi nous allons
considrer ici une loi uniforme U
|

1
2
,
1
2

. Le calcul de la matrice H nest pas trs ais pour une


telle distribution. Cest pourquoi nous allons nous appuyer sur les rsultats prcdents de la matrice
de covariance qui est invariante par translation de la population.
E
|
X
( k )
X
( l )

=Cov
|
X
( k )
X
( l )

+E
|
X
( k )

E
|
X
( l )

o
E
|
X
( k )

=
2 kn1
2 ( n+1 )
On en dduit la matrice H :
H=
1
40
|
4 1 2
1 2 1
2 1 4

En appliquant la relation (Eq 0) on trouve l aussi que lestimateur est le milieu.
Variance asymptotique du milieu
On peut montrer que la variance du L-estimateur des moindres carrs volue asymptotiquement en
1/n
2
alors que celle de la moyenne varie en 1/n dans le cas de la loi uniforme.
La variance d'un L-estimateur est dfinie par la relation suivante :
Var ( m)=C
t
HC=C
t
DC
En effet, pour des raisons de symtrie de la matrice H, les moments du bruit centr tant tantt
positifs tantt ngatifs, ces deux relations sont quivalentes.
Nous avons dmontr prcdemment les calculs de l'esprance de la variance et de la covariance
d'une statistique d'ordre dans le cas d'une distribution uniforme dfinie sur l'intervalle [0,1] Cette
dernire a pour variance 1/12.
Nous pouvons gnraliser ces rsultats des distributions uniformes de variance o
2
en multipliant
par un coefficient dchelle 12 o
2

.
Var
|
X
( k )

=12 s
2

k ( nk+1 )
( n+1 )
2
( n+2 )
Cov
|
X
( k )
, X
( l )

=12 s
2

k ( nl +1 )
( n+1 )
2
( n+2 )
avec1 kl n
Pour la suite du calcul, on ne s'intresse qu'aux coefficients placs dans les angles de la matrice R,
car les autres seront annuls lors de la multiplication avec le vecteur C des coefficients du filtre
milieu.
d'o R=
12 s
2
( n+1 )
2
( n+2 )

|
n L? L 1
M O M
1 L? L n


d'o Var | m=
t
CDC=
1
2

12 s
2
( n+1 )
( n+1 )
2
( n+2 )
=
6 s
2
( n+1 )( n+2 )
La variance asymptotique du L-estimateur est donc Lim
n-
( Var ( m))=
6 s
2
n
2
. Elle volue en 1/n
2
alors
que la moyenne empirique volue en 1/n : Lim
n-
( Var (

X ) )=
s
2
n
Etude de la Priode Oprationnelle Moyenne
Nous avons montr au travers de simulations [Duc 96]
62
que la rduction de la variance apporte
par le L-estimateur permettait damliorer la Priode oprationnelle dune carte de contrle de type
Shewhart.
Pour ces simulations, nous avons choisi de prendre les limites de contrle gales !3 s/ .n quelle
que soit la forme de la population et le type d'estimateur. On compare donc les performances des
cartes de contrle limites constantes. La Figure 41 donne dailleurs un aperu de la P.O.M. des
deux cartes de contrle tudies lorsque la population suit une loi normale. La P.O.M. est
reprsente en fonction du dcentrage k.o ou k est un rel. La distribution du L-estimateur tant
plus troite que celle de la moyenne, on minimise de faon importante les risques o, do une
P.O.M. importante pour k= 0.
P.O.M. pour la loi uniforme
k 0 0,2 0,4 0,7 1 1,25 1,5 2 3
n=3 L-Estim. NC
63
1284 159 31,1 10,3 5,27 3,15 1,44 1,01

X NC 1175 146 26,6 9,24 4,64 2,89 1,50 1,01


n=5 L-Estim. 1691 429 101 20,1 5,99 2,60 1,45 1,05 1,00

X 1058 263 61,7 13,1 4,46 2,42 1,59 1,08 1,00


n=7 L-Estim. 1720 449 95,7 15,1 3,46 1,44 1,12 1,00 1,00

X 650 177 39,8 7,72 2,70 1,62 1,20 1,01 1,00


Risque constant L-Estim. 650 217 53,2 9,77 2,38 1,25 1,07 1,00 1,00
Figure 40
P.O.M. pour une loi uniforme
0
200
400
600
800
1000
1200
1400
1600
1800
0
0
.
1
2
5
0
.
2
2
5
0
.
3
2
5
0
.
4
2
5
0
.
5
2
5
0
.
6
2
5
0
.
7
2
5
0
.
8
2
5
0
.
9
2
5
k
P
.
O
.
M
.
L-estimateur - n=5
L-estimateur - n=7
Moyenne - n=5
Moyenne - n=7
Figure 41
62
DUCLOS E. PILLET M. COURTOIS A. Optimisation de la Matrise Statistique des Procds par une mthode
de filtrage dordre - Revue de Statistique Applique XLIV (2) pp 61-79 - 1996
63
NC : Non calculable car les limites de contrle sont lextrieur de la distribution de la population.
Nous avons galement trait le cas qui consiste travailler risque o constant. Ainsi, pour la carte

X on fixe les limites de contrle 3 s/ .n , et on recalcule les limites de la carte de Shewhart avec
L-estimateur, de manire obtenir un risque o quivalent celui de la carte

X . Lexemple choisi
est celui dun chantillon de taille n=7 avec une distribution uniforme (Ligne grise de la Figure
40). Les limites sont fixes 2,76 s/ .n pour obtenir une P.O.M
k=0
= 650. Les calculs mettent en
vidence que la carte utilisant le L-estimateur minimise les risques de fausses dtections lorsque le
dcentrage est faible. En revanche, si le dcentrage est significatif (k>0,9), la P.O.M. de la carte de
contrle avec L-estimateur devient plus faible que celle de la carte

X (Figure 42). On constate par


exemple pour la limite suprieure 3 s/ .n=3/ .7=1, 13 , que P.O.M.
Moyenne
= 2 et P.O.M.
L-estimateur
=1,5 ; on dtecte donc les dcentrages beaucoup plus rapidement en utilisant un L-estimateur.
0
1
2
3
4
5
6
7
8
9
10
0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
k
P
.
O
.
M
.
Moyenne
L-estimateur
Figure 42
Ces premires simulations sur des distributions simples mais possdant un caractre non normal
prononc ont montr que les L-estimateurs pouvaient tre une alternative intressante lutilisation
de la moyenne dans un contexte non normal.
Nous avons donc cherch gnraliser notre approche aux lois non normales ne possdant pas de
proprit de symtrie.
Gnralisation au cas non symtrique
Choix du paramtre de localisation
Cas dune fonction perte symtrique
Lorsque la distribution de la population est symtrique, le choix du paramtre de localisation de la
population ne se pose pas rellement puisque la moyenne et la mdiane se superposent laxe de
symtrie de la courbe.
Dans le cas contraire ce choix est discutable car la mdiane et la moyenne ne correspondent pas
forcment une caractristique gomtrique de la loi. De plus, ces deux paramtres sont le plus
souvent distincts (Figure 43). La question qui se pose alors, est de savoir sil est prfrable de
choisir la moyenne plutt que la mdiane ou tout autre paramtre ?
Moyenne
Mdiane
Moyenne
Mdiane
Mode
Figure 43
Nous avons donc choisi de mettre en place un critre qui permette de dterminer un paramtre
optimal. Le cot de la non qualit nous est apparu un critre satisfaisant pour justifier le choix du
paramtre de localisation. En effet, nous allons chercher le paramtre de localisation qui, lorsquil
concide avec la cible du procd, permet de minimiser la perte au sens de Taguchi [Tag 89]
64
(Figure 44).
F
o
n
c
t
io
n

P
e
r
t
e
Cibl e
Paramtre de
localisati on
Figure 44
64
TAGUCHI G. ELSAYED A. HSIANG T. C. Quality engineering in production systems
Mc Graw-Hill - 1989
La justification du choix du paramtre
m
p
est assez triviale car il suffit de minimiser lexpression
de la perte moyenne par individu produit.
Tout dabord, rappelons que la fonction perte est dfinie par :
L=K
(
X X
0
)
2
o
- X est la valeur prise par une caractristique
- X
0
est la cible de la production
- K une constante qui dpend des cots engendrs par un dpassement des tolrances
Lexpression de la perte moyenne est donc

L=KE
| (
X X
0
)
2

On suppose que le paramtre de localisation est plac sur la cible :


m
p
=X
0

L=KE
| (
X m
p
)
2

=K
(
E | X
2
2 m
p
E | X +m
p
2
)
On cherche un extremum de la fonction en la drivant par rapport
m
p
:

L
m
p
=K
(
2 E ( X )2 m
p
)
=0m
p
=E ( X )
Le paramtre de localisation est donc la moyenne pour que la perte soit minimale quand ce
paramtre est gal la cible. Ceci est vrai quelle que soit la distribution de la population.
Cas dune fonction perte non symtrique
Le cot de la non qualit associ la production dune pice nest pas systmatiquement
symtrique. En effet les oprations effectues la suite dun dpassement de la tolrance
suprieure ne sont pas forcment aussi coteuses si on dpasse la tolrance infrieure.
Prenons lexemple rencontr pour lusinage de paliers ou des manetons de vilebrequins. Les pices
usines ont une forte valeur. On considre en effet que la perte dun vilebrequin entrane un cot de
2000 francs. Ce cas de figure est rencontr lorsque la tolrance infrieure du diamtre est dpasse.
En revanche si on dpasse la tolrance suprieure, on effectue une retouche qui est value 50
francs.
Dans ce cas il est vident que le paramtre moyenne ne permet pas de minimiser la perte lorsquon
le centre sur la cible (Figure 45). Il faut donc trouver un autre paramtre de localisation. Son choix
dpend ici des coefficients K
1
et K
2
de la fonction perte respectivement gauche et droite de la
cible.
TS TI
L
2
=K
2
(x
2
-x
0
)
2
C
i
b
le
L
1
=K
1
(x
1
-x
0
)
2
F
o
n
c
t
io
n

P
e
r
t
e
Figure 45
On note respectivement L
1
L
2
les pertes gauche et droite de la cible.

L
1
=K
1
(
X
1
X
0
)
2
X
1
X
0
L
2
=K
2
(
X
2
X
0
)
2
X
2
>X
0
On considre que la distribution de la population est centre sur la cible de telle manire que le
paramtre de localisation se superpose la cible :
m=X
0
P est la probabilit quune mesure soit infrieure au paramtre de localisation : P=Pr(X<)
La perte moyenne de la production est alors donne par :
E ( L)=K
1

-
m
( xm)
2
f ( x )dx+K
2

m
+
( xm)
2
f ( x)dx
Le minimum de E(L) sobtient en annulant sa drive par rapport soit :
m
(
K
1
. P+K
2
. ( 1P)
)
=K
1

-
m
xf ( x )dx+K
2

m
+
xf ( x )dx
La rsolution non triviale de cette quation o P dpend de ncessite la connaissance de la loi des
observations, ce qui est inacceptable dans un cadre non paramtrique.
Nous supposerons dans la suite de notre tude que la fonction perte est symtrique, dans ce cas le
paramtre estimer est la moyenne.
Choix du paramtre de dispersion
Pour le paramtre dchelle, nous navons pas mis en vidence de critre de choix particulier, si ce
nest laspect pratique. En effet, le paramtre qui parat le plus vident estimer est lcart type.
Exemple dapplication dun L-estimateur une loi non normale.
Caractristiques de la population
Nous avons choisi de traiter le cas dune population stratifie compose de 6 lois
lmentaires normales de mmes cart-types :
N
1
(0 , 1) N
4
(5 , 1)
N
2
(5.5 , 1) N
5
(5 , 1)
N
3
(-3.2 , 1) N
6
(-3.5 , 1)
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
-
8
-
6
-
4
-
2 0 2 4 6 8
1
0
x
f
(
x
)
N(5.0;1)
N(5.5;1)
N(0;1)
N(-3.2;0)
N(-3.5;1)
fp(x)
Figure 46
Cet exemple simule le cas industriel dune fabrication sur une presse avec 6 empreintes.
Les prlvements sur chacun des gnrateurs tant quiprobables (1 = 1/6), on dfinit la densit de
probabilit des critres gnrs par :
f X f X f X f X
p N N N
( ) ( ) ( ) ... ( ) = + + + t t t
1 2 6
La fonction perte tant symtrique, le paramtre de localisation est la moyenne m et le paramtre
dchelle est l'cart type s .
La mthode de calcul prsente dans le chapitre 2 (1.2.2) est utilise pour dterminer la moyenne
et lcart-type du mlange de lois.
D'o m=1 . 4667 s=3 . 9965
A titre dexemple, on donne (Figure 47&Figure 48) les coefficients des deux estimateurs pour n=3,
4 et 5. On remarque sur la Figure 47 que la fonction de poids est relativement proche de celle du
milieu de ltendue. Dans ce cas, on peut se demander si le choix du milieu de ltendue nest pas
une bonne solution chaque fois que la distribution de la population une tendance platikurtique.
Plusieurs considrations nous dissuaderons dune telle approche. Tout dabord, le milieu de
ltendue nest pas optimal en terme de variance pour toutes les lois tendance platikurtique. Et
dautre part, le paramtre de position quelle estime est diffrent de la moyenne lorsque la loi nest
pas symtrique.
L-estimateur de position
n c
1
c
2
c
3
c
4
c
5

3 0.52 -0.07 0.55
4 0.53 -0.06 -0.04 0.57
5 0.53 -0.045 -0.046 -0.01 0.57
Figure 47
L-estimateur de dispersion
n c
1
c
2
c
3
c
4
c
5

3 -0.58 -0.0037 0.59
4 -0.50 0.025 -0.025 0.50
5 -0.47 0.026 0.0013 -0.023 0.46
Figure 48
Etude de variance
Comme nous pouvons le constater dans le tableau de la Figure 49 et sur la Figure 50, la
variance du L-estimateur est toujours trs infrieure celle de la moyenne. Pour lindustriel, il est
alors possible de tirer parti de cette rduction de la variance en amliorant la commandabilit et
donc la capabilit de son procd de fabrication, ou en rduisant la taille des prlvements. Par
exemple, pour une moyenne calcule sur un chantillon de taille n=7, le L-estimateur ne requiert,
variance quivalente, quun chantillon de taille n=4.
Variance des estimateurs
Echantillon n = 3 n = 4 n = 5 n = 6 n = 7 n = 8 n = 9 n = 10
L-estimateur 4.29 2.46 1.52 1.01 0.72 0.55 0.44 0.36
Moyenne 5.32 3.99 3.19 2.66 2.28 2.00 1.77 1.60
Efficacit relative 0.81 0.62 0.48 0.38 0.32 0.28 0.25 0.22
Figure 49
Variance des estimateurs - Echantillonnage alatoire
0
1
2
3
4
5
6
3 4 5 6 7 8 9 10
n
V
a
r
i
a
n
c
e
L-estimateur
Moyenne
Figure 50
Remarque :
- La variance de la moyenne est calcule par s
2
/ n avec 1 l'cart type de la population.
- Lefficacit relative du L-estimateur par rapport la moyenne est donne par :
Var | m
Var | moy
Distribution des estimateurs
La distribution de la moyenne ainsi que la distribution des L-estimateurs dans certains cas sont
asymptotiquement normales. Cette tude ralise sur un trs grand nombre de donnes a montr
que pour une population fortement non normale, ni la moyenne ni le L-estimateurs ne suivent une
loi normale pour des chantillons de taille modre (Figure 51).
0
0.005
0.01
0.015
0.02
0.025
0.03
0.035
-6 -4 -2 0 2 4 6 8
p(X)
X
Distribution de la Moyenne - Echantillonnage alatoire
n=3
n=6
n=10
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
-6 -4 -2 0 2 4 6 8
p(X)
X
Distribution du L-estimateur - Echantillonnage alatoire
n=3
n=6
n=10
Figure 51
Alors que la distribution de la moyenne converge vers une loi normale, au fur et mesure que n
grandit, on constate que la distribution du L-estimateur possde une tendance leptokurtique.
Mise en oeuvre de la carte L
Construction du L-estimateur
La construction du L-estimateur de Lloyd ncessite le calcul de la matrice de covariance des
statistiques d'ordre rduites 8 ainsi que le vecteur des esprances des statistiques d'ordre o.
Nous savons que le calcul littral des moments dordre 1 et 2 des statistiques dordre est
particulirement pnible. En effet, les coefficients de la matrice de covariance sexpriment par la
relation (Eq 0).
Cov
|
X
r : n
X
s : n

-
y
(
xm
r : n
) (
ym
s : n
)
f
rs
( x , y )dxdy
Eq 0
avec
f
rs
( x , y )=
n!
( r1 )!( sr1 )! ( ns )!
F
r1
( x )f ( x ) ( F ( y )F ( x ))
sr1
p( y ) | 1P( y )
ns
Cette relation requiert que la loi de distribution de la population soit parfaitement connue. Il faut
donc identifier la population une loi paramtrique. Ceci, est inacceptable nos yeux pour deux
raisons :
- Dune part, il est tout fait illusoire de vouloir identifier la distribution dun critre dans des
conditions de production,
- Dautre part, cette procdure nous place dans un cadre paramtrique, que nous ne souhaitons
pas. Nous prfrons donc estimer O et o partir de mesures prleves sur le procd (Eq 0).
w
ij
=
1
m1

m
| (
x
( i )


x
( i )
) (
x
( j )


x
( j )
)

i
=
1
m

m
x
( i )
Eq 0
Le calcul de la matrice O et du vecteur o ncessitent que le procd soit stationnaire, autrement dit
quil soit sous contrle. En effet si linformation apporte par O et o est corrompue par une drive
du procd, les estimations pourront tre de mauvaise qualit.
Nous exposerons donc plusieurs mthodes pour calculer le L-estimateur, adaptes au type de
procd pilot.
Dmarrage dune carte L
Pour que lutilisation dun L-estimateur soit bnfique par rapport un estimateur comme la
moyenne, il est ncessaire que le surplus dinformation apport par la matrice de covariance et le
vecteur des moments soient cohrents avec ce que lon souhaite rellement modliser.
Procd
stationnaire
L'chantillon est
reprsentatif de la
population
L'chantillon ne
possde aucune des
caractristiques
statistiques de la
population
Procd non
stationnaire
Figure 52
Le problme est ici sensiblement quivalent celui rencontr lorsque lon veut calculer une
capabilit machine. Pour ce faire, on prlve les mesures sur une priode suffisamment courte pour
que les drives du procd (qui pourraient tre compenses par un bon pilotage) soient peu
significatives. Cette procdure est bien sr satisfaisante si le procd nest pas soumis un trop
grand nombre de perturbations.
La notion de stabilit est ici relative la cadence de production et non pas au temps. En effet, un
procd pour lequel on ne note quune faible drive pour un nombre important de pices produites
est prsum stable quel que soit le temps ncessaire cette production. En revanche, un procd
sera qualifi dinstable si des causes spciales sont frquemment identifiables.
Nous distinguerons deux cas : celui des procds volution rapide ou volution lente.
Les procds volution lente
Les procds volution lente sont en gnral assez peu problmatiques car la quantit de donnes
recueillables sur une priode stable suffit tablir les statistiques dintrt.
La norme AFNOR [AF1 95]
65
suggre, par exemple, de calculer la dispersion de la population
partir dune vingtaine de sous-groupes, lors de la priode de rfrence pralable toute mise en
place dune procdure M.S.P. Un minimum de trente valeurs individuelles est en effet souhaitable
pour que le calcul dune variance empirique converge vers une valeur exploitable.
65
AFNOR Norme NF X 06-031-1 Application de la Statistique - Cartes de contrle de Shewhart aux mesures ISSN
0335-3931
De manire analogue, nous avons montr exprimentalement que pour dbuter une carte L, trente
quarante chantillons suffisent pour que les coefficients de la matrice de covariance soient dans le
voisinage de leurs valeurs asymptotiques. Pendant le prlvement de ces donnes, on reportera la
moyenne et lcart type des chantillons sur une carte prliminaire, afin de sassurer de la stabilit
du procd (Figure 53). Aprs avoir calcul le L-estimateur, on peut placer les limites de la carte de
contrle. On vrifiera de manire rtrospective que le procd tait bien sous contrle pendant la
priode de rfrence. Dans le cas contraire, le calcul des coefficients du L-estimateur a t pollu
par des causes spciales.
Pilotage
Carte de contrle
Calcul du
L-estimateur
Carte de Suivi
o
o
o
e e
e e
o
=
|
\

|
.
|
|
|
=

(
(
(

=
|
\

|
.
|
|
|

1
2
1 1 1
1
1


O
, ,
, ,
n
n n n
L estimateur
n
Paramtres et
C
c
c
LIC
LSC
Cible
Figure 53
Cette priode dtude prliminaire nous semble acceptable pour un industriel. Nous savons
nanmoins par exprience, que les cartes dobservations prliminaires ne sont pas toujours utilises
sur des procds bien connus . Afin de rduire au minimum la priode de rfrence et viter
lutilisation dune carte de suivi au profit dune carte de contrle, nous proposons de faire voluer
les coefficients du L-estimateur progressivement de la moyenne (1/n) aux coefficients optimaux.
Pour cela nous avons choisi dutiliser un algorithme de lissage (Eq 0).
Au fur et mesure que les chantillons sont prlevs, les coefficients de l'estimateur C
Lissage
voluent de la moyenne (Ci= 1/n) vers les coefficients optimaux C
L-estimateur
estims laide de la
relation (Eq 0).
C
Lissage
=
k
k
max
C
LEstimateur
+( 1
k
k
max
)
|
1
n
M
1
n

Eq 0
On note k le numro de lchantillon prlev et k
max
le nombre d'chantillons qui fixe la fin de la
priode de rfrence. On choisira de prfrence une valeur de k
max
suprieure trente. Lorsque le
nombre dchantillon k atteint la valeur k
max
, les coefficients du L-estimateur sont ceux du L-
estimateur des moindres carrs.
Cette procdure a lavantage de permettre le pilotage du procd avec les seules valeurs et o
fixes par lexprience. De plus, rappelons que les coefficients obtenus par lissage donnent une
estimation sans biais de la position de la population puisquil sagit dune combinaison linaire de
deux estimateurs sans biais (Eq 0).
m=C
Lissage
X = C
Lestimateur
X
_
Estimation par les moindres carr s
+( 1)
1
n
eX
_
Moyenne
Eq 0
Nous prsentons titre dexemple (Figure 54, Figure 55 & Figure 56) une simulation du dmarrage
dune carte L de position avec k
max
= 40. Les coefficients du L-estimateurs sont initialiss 1/5 et
convergent respectivement [0.53 0.045 -0.045 -0.012 0.57]
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 10 20 30 40 50 60 70 80 90
C
o
e
f
f
i
c
i
e
n
t
s

d
u

L
-
e
s
t
i
m
a
t
e
u
r
Figure 54
1.0
1.5
2.0
2.5
3.0
3.5
0 10 20 30 40 50 60 70 80 90 100
n
V
a
r
i
a
n
c
e
Figure 55
-5
-3
-1
1
3
5
7
C
a
r
t
e

d
e

p
o
s
i
t
i
o
n
Moyenne L Estimateur
Figure 56
Nous pouvons constater que la variance de lestimation volue de o
2
/5 = 3,19 1,5 qui correspond
la variance du L-estimateur des moindres carrs. Nous aborderons dans le paragraphe suivant le
calcul des limites de contrle de la carte L.
Les procds volution rapide et les petites sries.
Si le calcul des coefficients du L-estimateur nest pas trop dlicat pour les procds relativement
stables, il nen est pas de mme pour ceux qui sont particulirement perturbs. En effet, les
priodes de stabilit tant trs courtes, il est difficile de recueillir suffisamment de donnes pour
construire le L-estimateur. Nous considrons que les petites sries se rapportent au mme cas de
figure puisque le nombre de donnes exploitables est faible.
Lide consiste donc exploiter au maximum le peu de donnes recueillies, pour faire converger
les coefficients de la matrice O et du vecteur o vers des valeurs raisonnables. Pour cela nous
utiliserons une mthode de type bootstrap partir dun chantillon de capabilit machine ou dune
carte prliminaire construite avec les toutes premires mesures dune srie courte.
Les mthodes bootstrap
Les mthodes bootstrap dj voques au chapitre prcdent font partie des mthodes intensives de
calcul. Elles se sont dveloppes avec la monte en puissance des ordinateurs. Cest une procdure
de rechantillonnage dont lobjectif est dtudier les proprits dune statistique T fonde sur un
chantillon (X
1
,X
2
, ...,X
m
) dune variable alatoire.
Lalgorithme du bootstrap est relativement simple. Nous le rsumerons en trois tapes (Figure 57) :
- Nous considrons tout dabord un chantillon indpendant E= (X
1
,X
2
, ...,X
m
).
- On prlve N valeurs de faon quiprobable avec remise, dans la population empirique que
constitue E. Lchantillon ainsi prlev est not E*.
- La dernire tape consiste tudier le comportement de la statistique bootstrape T*
construite partir de E*. Ainsi, on itre un grand nombre de fois le rechantillonnage et le calcul
de T* pour donner lieu une approximation par la mthode de Monte-Carlo.
Application un chantillon ordonn
Les statistiques tudies seront des statistiques dordre associes au calcul des lments de O et o.
Les chantillons bootstrap sont de la taille des sous groupes de la carte de contrle : N=n.
Ti X
( i )
i=1,2 , K , n
pour lments du vecteur o.
Ti
(
X
( i )


X
( i )
) (
X
( j )


X
( j )
)
1 i jn
pour les lments de la matrice O.
On note E
*
lesprance calcule partir de B chantillons bootstrap. Lesprance des statistiques
bootstrapes est calcule par la relation (Eq 0).
Ti
i
E
i
i
i
Eq 0
E
*
(T*); V
*
(T*); ...
2 20 60 87 90 84 60 45 35 20 15 10
Distribution de la population
L'ensemble des B
statistiques T* permet
d'approximer le
comportement de T.
On opre un
rechantillonnage alatoire
avec remise dans E . Chaque
chantillon bootstrap permet
de calculer une statistique
bootstrape T*.
On possde un chantillon
de N mesures
indpendantes. Cet
ensemble de mesures sert
de population de base.
Distribution empirique
E
Distribution de T*
E(T*)
o (T*)
Figure 57
Pr-requis lutilisation de la mthode bootstrap
- Cette mthode ne peut tre applique que si lchantillonnage effectu sur le procd est
alatoire. En effet, le rechantillonnage avec remise, limine toute corrlation entre les mesures
de lchantillon original. Dans le cas de procds multignrateurs, il se peut quun
chantillonnage alatoire ne soit pas adapt au suivi par carte de contrle. Lun des effets de
lchantillonnage squentiel, par exemple, est de rduire le nombre de combinaisons de
gnrateurs au sein dun chantillon. Il en rsulte une variance inter chantillon plus faible que
pour un chantillonnage alatoire. Dans ce cas le rechantillonnage aurait pour consquence de
modifier la variance inter chantillons et les valeurs de O et o. On est donc contraint de calculer
le L-estimateur partir des chantillons prlevs lors de la priode de rfrence, par la mthode
de lissage.
- Pour que lchantillon original soit reprsentatif de la population, il est ncessaire que le procd
soit stable pendant le prlvement de lchantillon. Plus la taille de lchantillon est grande, plus
les rsultats obtenus seront de bonne qualit. Avec une vingtaine de mesures individuelles, on
peut dj obtenir des coefficients du L-estimateur qui sont dans le voisinage des coefficients
optimaux.
Exemple dapplication
On se propose de suivre le procd dcrit au paragraphe . simulant une fabrication sur presse
injecter avec six empreintes.
- On procde un chantillonnage alatoire de taille n=5 pour construire la carte de contrle. Le
procd tant modrment stable, on prlve m=30 mesures individuelles (soit six chantillons
M.S.P.) dans un laps de temps relativement court pour que lvolution du procd ne soit pas
significative. Cet chantillon est lchantillon de base qui servira construire le L-estimateur par
la mthode bootstrap.
- On gnre B=1000 chantillons ordonns de taille n=5. On peut prlever jusqu'
K
m
n
=
m( m+1 ) L( m+n1 )
n!
=C
m+n1
n
chantillons diffrents partir de lchantillon original.
K
m+n1
n
tant le nombre de combinaisons avec rptition (Ici K
m+n1
n
=278256)
- On calcule partir de ces chantillons les coefficients de la matrice O et du vecteur o.
- Si le paramtre de localisation de la population est la moyenne, alors
m
p
=
1
B

i=1
B
1
n

j=1
n
X
i , j
i
i
,
la moyenne de lensemble des chantillons bootstrap.
- Le paramtre dchelle est lcart-type des B*n mesures individuelles.
- A lissue des calculs, on obtient les coefficients suivants :
L-estimateur de position
c
1
c
2
c
3
c
4
c
5
Coefficients par mthode Bootstrap 0.55 -0.030 -0.042 -0.027 0.55
Coefficients Optimaux 0.53 -0.045 -0.046 -0.010 0.57
On constate que les coefficients obtenus par mthode bootstrap sont trs proches des coefficients
optimaux. Lefficacit relative du L-estimateur de position par rapport la moyenne est de 0,49
avec les coefficients estims par la mthode bootstrap alors quelle est de 0,47 pour les coefficients
optimaux.
L-estimateur de dispersion
c
1
c
2
c
3
c
4
c
5
Coefficients par mthode Bootstrap -0.49 0.034 -0.062 -0.0047 0.47
Coefficients Optimaux -0.47 0.026 0.0013 -0.023 0.46
Les coefficients obtenus par la mthode bootstrap permettent un suivi de trs bonne qualit, comme
on peut le constater sur la Figure 58.
-4.5
-2.5
-0.5
1.5
3.5
5.5
7.5
Xb L-EstX Cible X
0
2
4
6
8
S L-EstS
Figure 58
Calcul des limites de contrle
Outre le calcul du L-estimateur, la construction dune carte L ncessite galement la dtermination
de limites de contrle. Celles-ci permettent de prciser le moment opportun pour effectuer un
rglage. Les limites de contrle dune carte de Shewhart sont en gnral places !3 s
p
/ .n , de
faon obtenir un risque o de lordre de 0,27% dans lhypothse dune population relativement
proche dune loi normale. Cette hypothse sort bien entendu du cadre de notre tude. Il est donc
indispensable de reconsidrer le choix des limites de contrle.
Problmatique
Le calcul ou lvaluation de la distribution dun L-estimateur est un problme qui reste encore
entier lheure actuelle. En effet les calculs sont relativement complexes et ncessitent la
connaissance de lexpression de la loi de distribution de la population, ce qui nest pas notre cas. Le
calcul des lois exactes ntant pas concevable, nous aurons recours des approximations.
Nous avons expos au chapitre prcdent quelques mthodes permettant dtablir les limites de
contrle dune carte de la moyenne, pour des lois non normales. Les mthodes exposes sont pour
la plupart bases sur lidentification dune loi paramtrique (Courbes de Burr [You 92], loi de
Weibull [Sch 96]
66
etc.). La parfaite connaissance des caractristiques de la loi permet de
dterminer aisment les limites de contrle telles que les risques o soient de lordre de 0,27%.
Ces mthodes nous apparaissent cependant peu intressantes du fait de leur approche paramtrique,
qui par essence ne peut satisfaire tous les cas de figure. De plus, la modlisation des queues dune
distribution reste modrment fiable, surtout si cette modlisation est ralise partir dun
chantillon reprsentatif de faible taille.
Intervalle de confiance pour un paramtre de localisation
Notre souci tant principalement de fournir une mthode gnrale, nous allons rappeler plusieurs
mthodes classiques, permettant de dterminer un intervalle de confiance pour un paramtre de
localisation. Nous discuterons ensuite de leurs avantages et inconvnients dans le cadre de notre
application.
La construction dun intervalle de confiance ncessite gnralement la connaissance de la loi des
observations pour pouvoir garantir un certain niveau de confiance. Nanmoins il existe des
mthodes dites distribution-free qui ne postulent aucune loi a priori.
Deux mthodes sont couramment proposes lorsque lon considre un modle non paramtrique de
localisation chelle. Il sagit dune mthode base sur les p-quantiles empiriques dun chantillon
ordonn et dune autre approche au caractre un peu plus arbitraire.
66
SCHNEIDER H. KASPERSKI W.J. & al Control charts for skewed and censored data
Quality engineering 8(2):263-274 - 1996
Intervalle de confiance pour un p-quantile
Une mthode qui rsulte des proprits des statistiques dordre, consiste calculer lintervalle de
confiance dun p-quantile
p
= 0.5. Lintervalle de confiance est alors dfini par deux statistiques
dordre X
(i)
et X
(m+1-i)
o m est le nombre de mesures disponibles. On cherche donc dfinir lentier
i tel que :
P
(
X
( i )
x
p
X
( m+1i )
)
=

r=i
mi
r !
r !( mr ) !
( 1/ 2)
m
1
Cette mthode a lavantage de permettre la construction dun intervalle de confiance partir des
ralisations dune variable alatoire, quelle que soit sa loi. Nanmoins les travaux de Willemain et
Runger [Wil 96] (voir Chapitre 2 3.3.2) montrent que la Priode Oprationnelle Moyenne dune
carte de contrle construite sur ce principe est trs influence par la dispersion des statistiques
dordre X
(i)
et X
(m+1-i)
. Cela implique que les limites soient calcules partir dun chantillon
important. En effet Willemain suggre de prlever quatre fois plus dchantillons que la POM
souhaite pour que les limites soient fiables. Si lon souhaite P.O.M
k=0
=370 pour maintenir un
risque o=0.27%, alors il fait possder au moins 1480 observations. Ceci nest malheureusement pas
admissible, dautant plus que les observations qui proviennent du L-estimateur, sont peu
nombreuses lors de la priode de rfrence.
Intervalle de confiance universel
Une deuxime mthode, est dutiliser lintervalle de confiance qui simpose lorsque les
observations proviennent dune loi normale ou de Student. Ceci est trs souvent le cas, mme si le
modle ne le justifie pas. On dfinit cet intervalle de confiance par la relation (Eq 0).
|
mt
n

s
.n
; m+t
n

s
.n

Eq 0
O
m
est un estimateur du paramtre de localisation tandis que s est un estimateur du
paramtre de dispersion. La valeur t
n
est telle que le niveau de cet intervalle de confiance soit au
moins gal 1-o. Or la grandeur de t
n
, dpend de la loi de m / s , qui elle mme dpend de la loi
des observations que nous ne connaissons pas. Pour que les limites soient conformes celles de la
carte de Shewhart lorsque la variance du L-estimateur est proche de celle de la moyenne, il est
possible de prendre t
n
=3.
Cette dernire mthode, ne se caractrise pas par sa prcision car il est difficile davoir une ide des
risques engendrs. En procdant de manire quivalente, il est possible de choisir des limites de
contrle dont la philosophie se rapproche un peu plus de celle des autres cartes de contrle, tout en
conservant un niveau de confiance acceptable.
Limites traditionnelles des cartes de contrle
La plupart des cartes de contrle bases sur le principe de Shewhart, comme la carte aux tendues
(R ), la carte aux cart-types (S), les cartes aux attributs (p, np, c et u) construisent leurs limites
!3 cart-types de lestimateur utilis (Eq 0).
LSC=Cible+3 s
Lestimateur de Localisation
LIC=Cible3 s
Lestimateur de Localisation
Eq 0
Ce choix bien quarbitraire garantit nanmoins un fonctionnement satisfaisant des cartes de
contrle. Les risques o sont bien entendus diffrents des 0,27% de la carte de Shewhart mais restent
dun ordre de grandeur acceptable. Dailleurs, le raffinement qui consiste calculer des limites de
contrle assurant un risque de 0,27% apparat futile quand on remarque que les risques o peuvent
scarter de manire importante de la valeur souhaite, mme quand la population suit une loi
normale. Il suffit de faire quelques simulations pour sen convaincre. On effectue, par exemple, 30
tirages dune variable alatoire suivant une loi normale, on calcule lcart type empirique S de
lchantillon, puis on place les limites de contrle !3 s/ .n de la cible, o o est estim par
lcart-type empirique S. Les risques engendrs par de telles limites peuvent varier de 3% 0,01%.
Nous allons discuter le choix des limites de contrle pour la carte L de position. Ce choix tant li,
comme nous allons le voir, la tolrance du L-estimateur aux valeurs extrmes.
Choix des limites de contrle
Tolrance aux valeurs extrmes
Parmi les populations quil peut nous tre donn de rencontrer, nous distinguerons deux familles de
lois. Celles qui ont des queues plus lourdes que la loi normale, comme la loi double exponentielle,
et celles qui ont des queues plus lgres, comme la loi uniforme.
Lefficacit dun L-estimateur est conditionne par sa fonction de poids. Celle-ci affectera
beaucoup de poids aux valeurs centrales du L-estimateur si les queues de la loi de la population
sont plus lourdes que celles de la loi normale (mdiane). En revanche, on donnera plus de poids aux
valeurs extrmes si les queues de la loi sont plus lgres que celles de la loi normale (milieu).
Si les poids affects aux valeurs extrmes X
(1)
et X
(n)
ne sont pas nuls et si lune ou lautre de ces
valeurs prend une valeur exagrment grande, elle affectera de faon importante le rsultat du L-
estimateur. On retiendra en effet, que si la fonction de poids dun L-estimateur, dfinie sur [0,1], est
non nulle dans le voisinage de 0 et 1, alors la tolrance aux valeurs extrmes est nulle (voir ).
Cest le cas de la moyenne empirique par exemple, mais galement celui du L-estimateur de
moindres carrs dans la plupart des cas.
Dans les cas o la population a des queues soit beaucoup plus lourdes, soit beaucoup plus lgres
que celles de la moyenne, la distribution du L-estimateur des moindres carrs sera leptokurtique.
- En effet, dans le cas dune population platikurtique, la faible robustesse aux valeurs extrmes se
traduira par des queues lourdes pour sa distribution.
- Dans le cas dune population leptokurtique, la faible pondration des coefficients extrmes ne
pourra liminer totalement la prsence des queues de la population, du fait de la faible taille des
chantillons.
Ainsi, les risques engendrs par des limites (Eq 0) seront toujours suprieurs 0,27%. Lordre de
grandeur de ces risques volue sensiblement selon la taille des chantillons et la symtrie de la
population. On aura souvent des valeurs de lordre de 2%.
Nous distinguerons deux cas dans le choix des limites de contrle :
- Si lobjectif est de minimiser les risques o, on choisira lintervalle de confiance donn par (Eq
0), soit :
LSC=m
p
+3
s
.n
LIC=m
p
3
s
.n
Les risques seront trs infrieurs 0.27% si la population est platikurtique. Ils seront en revanche
plus grands pour une population leptokurtique.
- La deuxime alternative (Eq 0) fournit des risques suprieurs ou gaux 0,27%. Ils sont toujours
suprieurs ceux engendrs par les limites (Eq 0).
Intervalle de confiance pour le paramtre dchelle
Pour le paramtre dchelle, la construction de lintervalle de confiance est relativement simple. On
constate en effet que la distribution de lcart-type empirique et du L-estimateur de dispersion sont
toujours extrmement proches lune de lautre.
Malgr la similarit des distributions nous choisirons les limites (Eq 0) qui ont lavantage de
prendre pour cible o
p
. De plus, les limites de contrle traditionnelles (Eq 0) sont construites partir
du coefficient c
4
qui introduit un biais lorsque la distribution des observations ne suit pas une loi
normale.
LSC=
(
c
4
+3
.
1c
4
2
)
. s
LIC=
(
c
4
3
.
1c
4
2
)
. s
Eq 0
LSC=s+3 s
Lestimateur
LIC=s3 s
Lestimateur
Eq 0
Les limites de contrle des deux cartes L tant dtermines, il est possible de piloter de manire
statistique un procd. Nanmoins il existe dautres rgles de contrle, qui ne sont pas bases sur le
test par intervalle de confiance, qui mritent dtre tudies.
Incidence sur les rgles de pilotage
Le pilotage par carte de contrle est rgi par un certain nombre de rgles de dcision qui sappuient
sur la statistique. Les rgles nonces dans le cadre de lutilisation des cartes L, sont sensiblement
quivalentes celles utilises pour une carte de type Shewhart, sous certaines conditions. Nous
commenterons les cinq situations entranant une prise de dcision de la part de loprateur.
Procd sous contrle
Rgle de pilotage
Les points reports sur la carte de position et de dispersion oscillent de
part et dautre de la cible. Le procd est parfaitement centr.
Si la distribution de lestimateur suit une loi normale alors la
probabilit quune mesure soit dans lintervalle de confiance !s est
p=0.683. Cest pourquoi on nonce souvent un quota de 2/3 des points dans le tiers central de la
carte de contrle. Cette dernire rgle nest donc pas applicable la lettre avec un L-estimateur du
fait du caractre leptokurtique de sa distribution (p>0.683). Elle na dailleurs quun intrt limit
partir du moment o le procd ne rpond pas aux diffrentes rgles qui suivent (procd hors
contrle).
Dcision
Il faut poursuivre la production.
Procd hors contrle
Rgle de pilotage
Le dernier point plac sur la carte de position ou de dispersion est en
dehors des limites de contrle.
Lhypothse H0 du test par intervalle de confiance nest pas valide,
que le niveau de confiance 1-o soit parfaitement ou partiellement
connu. Le procd est hors contrle. Il faut donc intervenir sur le procd.
Dcision
Si un tat hors contrle est dtect sur la carte de position le procd est dcentr. On prconise
alors deffectuer un rglage de la valeur qui spare le point de la cible.
Si un point hors contrle est not sur la carte de dispersion, la capabilit machine peut avoir volu.
On vrifiera tout dabord que le dcentrage nest pas imputable une erreur de mesure. Dans le cas
contraire, la distribution de la population ayant volu, il faut recalculer les coefficients du L-
estimateur.
La dtection dun point hors contrle peut tre le seul fait dune volution du paramtre dchelle
de la population, auquel cas les coefficients du L-estimateur fournissent encore une estimation sans
biais variance minimale. Cependant il est difficile de vrifier cette hypothse et la dtection dun
point hors contrle dclenche le plus souvent des actions correctives qui modifient le comportement
du procd. Cest pourquoi nous conseillons fortement de recalculer les coefficients du L-
estimateur et dappliquer lune des procdures de dmarrage dcrites au paragraphe 4.2 de ce
chapitre.
Tendance Suprieure ou Infrieure la cible
Rgle de pilotage
Sept points conscutifs sont dtects au dessus ou en dessous de la
cible, tout en restant entre les limites de contrle.
Ce test est li des proprits de symtrie de la distribution de
lestimateur utilis. Intressons nous tout dabord une carte

X . La
cible de la carte de contrle est le plus souvent la moyenne des estimations

X . Si la distribution de

X suit une loi normale ou possde des proprits de symtrie, alors la moyenne des moyennes

X est confondue avec la mdiane des moyennes. Dans lhypothse o le procd est centr, la
probabilit quun point tombe dun ct ou de lautre de la cible est de 0,5. La probabilit de voir
des points conscutifs dun ct de la cible est donc relativement faible.
Le phnomne peut tre considr anormal au bout de sept points conscutifs car la probabilit
quun huitime point tombe de ce mme ct est du mme ordre de grandeur que les risques o.
Lhypothse H0 nest donc plus valable.
Cette rgle veut que la distribution de lestimateur soit symtrique. On peut cependant trouver
assez facilement des contre-exemples comme lcart type S et ltendue R dont les distributions
sont non symtriques.
Dans les diffrentes tudes ralises, la distribution du L-estimateurs de position de Lloyd sest
avre avoir une tendance centrale et des proprits de symtrie plus fortes que la moyenne, dans
un contexte non normal. De plus, la distribution du L-estimateur de dispersion est la plupart du
temps semblable celle de lcart type. Cette rgle nous semble donc tout fait applicable aux
cartes L. La valeur fatidique de 7 points conscutifs peut nanmoins tre revue si lon a la certitude
que les risques o sont trs diffrents de 0,27%. Le nombre de points peut tre dfini de telle sorte
que la probabilit dtre n fois conscutives du mme ct (0.5
n
) soit du mme ordre de grandeur
que les risques o associs la position des limites de contrle. On peut citer, par exemple, la norme
AFNOR [AF1 95]
67
qui considre que 9 points conscutifs du mme ct permettent de conclure
un dcentrage du procd ; la probabilit dun tel vnement est de 0,002.
Dcision
Si une tendance est dcele sur la carte de position, il est conseill de rgler le procd de lcart
moyen qui spare la tendance de la cible. Il faut noter dans ce cas que le rglage prconis par le L-
estimateur de position sera bien meilleur que celui donn par la moyenne pour un chantillon de
mme taille.
Si la tendance est dtecte sur la carte de dispersion, il est prfrable de recalculer le L-estimateur
ainsi que les limites des deux cartes de contrle.
Tendance Croissante ou Dcroissante
Rgle de pilotage
Sept points conscutifs forment une tendance croissante ou
dcroissante.
Ce test sappuie sur lhypothse dindpendance des donnes. Sous
cette hypothse, les points reports sur les cartes doivent former un
trac dont les tendances sont alternativement croissantes ou dcroissantes. Si ce nest pas le cas, il y
a de fortes chances que le procd soit en train de driver.
P
(

X
i


X
i+1
L

X
i+1
)
=1/7!
Ceci est vrai quel que soit lestimateur utilis et quelle que soit sa distribution.
67
AFNOR Norme NF X 06-031-1 Application de la Statistique - Cartes de contrle de Shewhart aux mesures ISSN
0335-3931
Dcision
Si une tendance croissante ou dcroissante est dtecte sur la carte de position, on recentre le
procd de la valeur qui spare le dernier point de la cible.
Si une tendance est rvle sur la carte de dispersion, on recalcule le L-estimateur et les limites de
deux cartes de contrle ; comme dans le cas prcdent.
Point proche dune limite de contrle
Rgle de pilotage
Le dernier point est situ dans le sixime suprieur ou infrieur de la
carte, proche des limites. Le procd nest pas hors contrle,
cependant le procd peut avoir subi un dcentrage. Si le point est
excentr du fait des causes communes, la probabilit est trs faible
quun second point se situe dans la mme zone.
Dcision
On prlve immdiatement un autre chantillon. Si le point report se trouve dans le tiers central de
la carte, ce ntait quune fausse alerte. On repasse donc en production.
Pour la carte de position, si le second point se trouve dans la mme zone que le premier, le procd
est dcentr. On prconise alors de rgler de la valeur qui spare la cible de la moyenne de ces deux
points.
Pour la carte de dispersion, on sintressera uniquement au cas o deux points sont proches de la
limite suprieure. La capabilit machine stant dtriore, on recalcule le L-estimateur et les cartes
de contrle.
Synthse des rgles de pilotage
Ltude dtaille de ces cinq rgles de pilotage montre que la carte L ne requiert pas de mthode de
pilotage spcifique. Nous navons apport aucune modification aux rgles traditionnelles de
pilotage du point de vue de leurs principes. En revanche, nous avons rappel les fondements
mathmatiques de chacune de ces rgles afin de nuancer leur application dans des cas o la
distribution de lestimateur ne suit pas une loi normale. Nous avons galement prcis quels
vnements taient susceptibles de remettre en cause les coefficients du L-estimateur.
Lutilisation et linterprtation de cartes de contrle avec L-estimateur sera donc totalement
transparente pour un utilisateur libr des procdures de calcul.
Sensibilit de la carte L
La sensibilit des cartes de contrle est une des caractristiques essentielles permettant de juger
leurs performances. Pour apprhender ce niveau de performance on peut procder de deux manires
sensiblement quivalentes. La premire consiste calculer la priode oprationnelle moyenne
(P.O.M.) pour un dcentrage donn, lautre se rsume calculer la forme de la distribution de
lestimateur pour dterminer la probabilit de dtecter un tat hors contrle. Cette dernire mthode
nest dailleurs applicable que pour les cartes de contrle de type

X .
La Priode Oprationnelle Moyenne est un indicateur reconnu par lensemble des professionnels de
la qualit ; une description est dailleurs propose dans la norme AFNOR paru en 95 [AF1 95]. Les
tudes de P.O.M. peuvent, dans des cas simples, tre ralises par calcul. Cest le cas de la carte de
Shewhart dans des conditions de normalit du procd. Lorsque lhypothse de normalit de la
population nest pas valide, ou que lestimateur utilis nest pas la moyenne, on procde par
simulations informatiques. Lors de ces tudes, on suppose galement que les caractristiques de la
population ne sont pas affectes par le dcentrage (ce nest pas le cas dun dfaut de forme par
exemple).
Dans un premier temps nous avons ralis une tude de P.O.M. de faon valuer les amliorations
potentielles dune carte L par rapport la carte de Shewhart. Etant donn le caractre non
paramtrique de notre approche, les performances de la carte dpendent de la population tudie.
Nous avons donc jug utile de traiter un cas o le L-estimateur possde une variance trs infrieure
celle de la moyenne, pour vrifier si lamlioration en variance se rpercutait sur la P.O.M. Nous
avons galement choisi de traiter un cas o la variance du L-estimateur est proche de celle de la
moyenne, pour sassurer que les performances de la carte L ne sont pas infrieures celles dune
carte

X .
La seconde partie de notre tude concerne le suivi dun procd dont lvolution se traduit par une
modification de la distribution de la population.
Sensibilit un dcentrage
Cas dune non normalit trs marque
La dtection des drives aussi bien rapides que lentes sur un procd de production est li au choix
des limites de contrle et la distribution de lestimateur utilis.
Le premier cas que nous avons choisi de prsenter est celui dune distribution possdant des queues
lgres (Figure 59). Il sagit dun mlange de lois normales de moyennes diffrentes. Nous avons
vu au paragraphe que la forme de la population avait une rpercussion importante sur la
distribution des estimateurs, surtout si les chantillons sont de petite taille. Il en rsulte que les
risques o sont infrieurs 0.27% lorsque les limites sont places
!3 s
p
/ .n
. Cela se traduit par
une POM suprieure 370.
Pour le L-estimateur, le problme est un peu dlicat car nous ne connaissons pas a priori sa
distribution.
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
Population Loi Normale
Figure 59
Nous avons donc calcul les P.O.M. de la carte

X et de la carte L dans les mmes conditions. Il


ressort de cette tude trois points essentiels :
- La P.O.M. de la carte L avec des limites place !3 s/ .n est dun ordre de grandeur
quivalent celle de la carte

X , pour des dcentrages k compris entre - 3/ .n et + 3/ .n . Pour
des dcentrages infrieurs aux limites de contrle, cest le poids des queues qui dtermine la
P.O.M. Cest pourquoi les rsultats peuvent tre trs variables selon la taille des chantillons
(Figure 60).
- Pour des dcentrages suprieurs aux limites de contrle, la P.O.M. de la carte L tend plus
rapidement vers 1 que la carte

X . Ceci sexplique par le caractre impulsionnel de la loi du L-
estimateur. Une faible augmentation du dcentrage occasionne une forte augmentation de la
probabilit de dtecter le dcentrage.
0
200
400
600
800
1 000
1 200
1 400
1 600
-1.0 -0.5 0.0 0.5 1.0
k
P
.
O
.
M
.
Carte L
Carte Xb
1
2
3
4
5
6
7
1.0 1.2 1.4 1.6 1.8 2.0
k
P
.
O
.
M
.
Carte L
Carte Xb
Figure 60
- La P.OM. de la carte L pour des limites places
!3 s
Lestimateur
est toujours infrieure la
P.O.M. de la carte

X . Les risques o sont ici de lordre de 0.6%, ce qui est loin dtre alarmant
(Figure 61). Le choix de telles limites a lavantage de fournir une carte trs sensible aux
dcentrages.
0
200
400
600
800
1 000
-1.0 -0.5 0.0 0.5 1.0
k
P
.
O
.
M
.
Carte Xb
Carte L
0
1
2
3
4
5
1.0 1.2 1.4 1.6 1.8 2.0
k
P
.
O
.
M
.
Carte Xb
Carte L
Figure 61
k Carte L
3 s/ .n
Carte

X Carte L
3 s
Lestimateur
0 1440 938 180
0.1 880 580 160
0.2 420 240 90
0.5 50 30 20
1 6.2 4.3 3.0
1.5 1.4 1.8 1.2
Figure 62
La Figure 62 permet de faire une rapide synthse des caractristiques des Priodes Oprationnelles
Moyennes des diffrentes cartes. Pour illustrer ces rsultats nous avons simul sur une carte de
contrle la drive dun procd (Figure 63). La drive simule est linaire. En effet le dcentrage de
la population est proportionnel au numro de lchantillon, ce qui signifie que le procd est
stationnaire pendant la constitution de lchantillon.
- On peut constater que la dtection de la drive est faite un peu plus tt avec la moyenne quavec
le L-estimateur lorsque les limites sont places !3 s
p
/ .n (LC1). Ceci sexplique par la
variance importante de la moyenne par rapport au L-estimateur. Nous pouvons considrer que
nous navons pas eu de chance car la moyenne surestime tout le temps la position du procd
entre lchantillon N35 et lchantillon N46. Dans le cas contraire, nous aurions pu dtecter
cette drive avec le L-estimateur bien avant, puisquil suit avec prcision la tendance du
procd.
- La dtection est en revanche plus rapide (chantillon N27) avec les limites places
!3 s
Lestimateur
(LC2) au risque de gnrer un nombre important de fausses alarmes.
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Moyenne L-estimateur LC1 Tendance Cible LC2
Figure 63
Si nous avions appliqu la rgle de pilotage qui consiste compter le nombre de points conscutifs
dun mme ct de la cible, nous aurions dtect la drive du procd ds lchantillon N15 avec
le L-estimateur alors que cela naurait t fait (avec beaucoup de perspicacit) quau 24
me
chantillon avec la moyenne.
Cas dune faible non normalit
Dans le cas dune faible non normalit, lamlioration apporte par le L-estimateur en terme de
variance est assez peu significative. Lexemple propos met en uvre un L-estimateur de position
dont lefficacit relative par rapport la moyenne est de 0,85.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Population Loi Normale
Figure 64
Dans ce cas, on constate que la carte L et la carte

X ont un comportement sensiblement


quivalent. La P.O.M de la carte L est trs proche de celle de la carte

X pour les mmes limites


de contrle (Carte L1). Ce rsultat nous conforte dans lide que la carte L, reste, dans le cas
gnral, au moins aussi sensible que la carte de

X .
Pour des limites places
!3 s
Lestimateur
les risques sont plus faibles que prcdemment et
tendent vers 0.27% si le L-estimateur optimal est la moyenne.
0
100
200
300
400
500
600
700
800
-1.0 -0.5 0.0 0.5 1.0
k
P
.
O
.
M
.
Carte L1
Carte Xb
Carte L2
0
1
2
3
4
5
6
1.0 1.2 1.4 1.6 1.8 2.0
Carte L1
Carte Xb
Carte L2
Remarque
Dans le cas de populations fortement dissymtriques, la P.O.M. obtenue pour les diffrentes cartes,
sera elle aussi dissymtrique. Yourstone montre dans ses travaux que le choix des limites peut
permettre de minimiser cette dissymtrie, mais que ce nest pas suffisant.
Sensibilit une dformation de la population
La seconde partie de notre tude concerne la dtection dune dformation de la population. Ce
phnomne peut tre mis en vidence sur une presse injecter, si le conduit dinjection dune des
empreintes tend sobstruer. On aura le mme comportement si on a un dfaut de serrage sur une
des broches dun tour.
Ce problme est dun intrt fondamental pour lutilisation des cartes L. En effet, nous savons
quun L-estimateur des moindres carrs est construit partir de la matrice de covariance des
statistiques dordre, qui apporte une information fortement lie lchantillonnage et la
distribution de la population. Or, si cette distribution volue, le L-estimateur ne sera plus en mesure
de fournir une estimation variance minimale, ni mme sans biais. La question qui se pose alors,
est de savoir si la dtection dune dformation est possible avant que les performances du L-
estimateur ne se dgradent trop. Cette question a trait donc la robustesse du L-estimateur des
moindres carrs.
Cadre de notre tude
Nous avons vu au paragraphe () les deux conditions pour quun L-estimateur soit robuste selon
Huber. La premire condition, qui est relative aux poids des coefficients extrmes nest
quexceptionnellement satisfaite avec le L-estimateur des moindres carrs. Le second critre
demande que les lois convergent rapidement vers 0 et 1 pour que lestimateur soit robuste. Cette
condition peut tre satisfaite si la distribution de la population est tronque ou a des queues lgres.
Ceci ne concerne donc quun nombre limit de cas.
Le cadre non paramtrique tant peu propice aux dmonstrations, nous avons tudi le cas ou le L-
estimateur de position est de toute vidence trs peu robuste. Ils sagit en loccurrence du cas ou les
coefficients extrmes sont fortement pondrs.
-8 -6 -4 -2 0 2 4 6 8 10 12
Loi N1
-8 -6 -4 -2 0 2 4 6 8 10 12
Loi N2
-8 -6 -4 -2 0 2 4 6 8 10 12
Loi N3
Figure 65
Cette tude ralise par simulation informatique a conduit la comparaison des distributions des L-
estimateurs de position et de dispersion, respectivement avec celles de la moyenne et de lcart
type.
Les comparaisons ont t ralises sur trois distributions qui diffrent lgrement les unes des
autres (Figure 65). Dans des conditions normales, la distribution de la population suit la loi N1. Au
fur et mesure que le procd se dgrade, la distribution des observations suit la loi N2 puis la loi
N3. Dans cet exemple, les estimations ralises laide de la moyenne et du L-estimateur
sappuient sur des chantillons deffectif n=5.
Estimateurs dun paramtre de localisation Estimateurs dun paramtre de dispersion
Loi N1 N(5,1) N(5.5,1) N(5.0,1) N(0,1) N(-3.2,1) N(3.5,1)
-4.1 -2.8 -1.5 -0.3 0.9 2.2 3.4 4.7 5.9 7.2 8.4
L-estimateur
Moyenne
0.4 1.0 1.6 2.2 2.8 3.4 4.0 4.6 5.2 5.8 6.4 7.0 7.7
L-estimateur
S
Loi N2 N(7,1) N(5.5,1) N(5.0,1) N(0,1) N(-3.2,1) N(3.5,1)
-4.0 -2.8 -1.5 -0.3 0.9 2.1 3.4 4.6 5.8 7.0 8.2
L-estimateur
Moyenne
0.4 1.1 1.7 2.4 3.1 3.7 4.4 5.0 5.7 6.4 7.0 7.7
L-estimateur
S
Loi N3 N(10,1) N(5.5,1) N(5.0,1) N(0,1) N(-3.2,1) N(3.5,1)
-4.0 -2.7 -1.2 0.2 1.6 3.1 4.5 5.9 7.4 8.8
L-estimateur
Moyenne
0.4 1.2 2.0 2.9 3.7 4.5 5.3 6.1 6.9 7.7
L-estimateur
S
Figure 66
On considre que la Loi N1 reprsente la distribution de la population lorsque le procd est
stationnaire. Les coefficients du L-estimateur de Lloyd ont donc t calculs partir de ce modle.
Dans ce cas, le L-estimateur de position m et de dispersion s sont sans biais et variance
minimale. Nous allons donc valuer quelles sont les pertes de performance du L-estimateur lorsque
la loi originale subit une faible dformation (Loi N2) puis un forte dformation (Loi N3).
Les diffrents indicateurs de performance tudis sont :
- Lefficacit relative de la moyenne par rapport au L-estimateur de position
ER(

X , m)=Var | m /Var |

X
- Lefficacit relative de lcart type empirique par rapport au L-estimateur de dispersion
ER( S , s)=Var | s /Var | S
- Le biais rduit du L-estimateur de position
B
m
=
(
mm
p
)
/ s
p
- Le biais rduit du L-estimateur de position
B
s
=
(
ss
p
)
/ s
p
ER(

X , m) ER( S , s) B
m
B
s
Loi N1 0.5 0.9
~0 ~0
Loi N2 0.5 0.9
~0.02 ~0
Loi N3 0.7 1
~0.1 ~0
Figure 67
Rsultats
Nous retiendrons de cette tude les points suivants :
- Le trac des distributions Figure 66 confirme la faible robustesse du L-estimateur des moindres
carrs pour un paramtre de localisation. En effet, sa distribution est affecte de manire
significative par lvolution de la population contrairement la moyenne qui savre plus
robuste.
- Malgr la forte dgradation des performances du L-estimateur de position, (qui se traduit par une
augmentation importante de lefficacit relative de la moyenne par rapport au L-estimateur) son
biais reste modr. Les corrections ventuelles que lon apportera au procd ne seront donc pas
dommageables sa stabilit.
- Le L-estimateur de dispersion semble plus robuste aux volutions de la population car son biais
reste ngligeable. Le dcalage entre s et S que lon peut constater sur les trois courbes est
essentiellement imputable au biais de S en tant questimateur de o
p
. Rappelons dailleurs que
dans le cas dune loi non normale,

S / c
4
est aussi un estimateur biais de o
p
.
- Lvolution de la moyenne de la population, lie sa dformation est ici trs faible (k= 0.2 entre
les Lois N1 & 3). En consquence, la dtection de ce dcentrage par un dpassement des limites
de contrle est peu probable. On peut faire la mme remarque pour la dispersion de la
population. Nanmoins, les performances des L-estimateurs tant encore acceptables, on peut
dtecter lapparition dune tendance sur les deux cartes L (Figure 68).
Dautres simulations, effectues sur une population leptokurtique ont mis en vidence les mmes
phnomnes.
- Malgr la faible pondration des coefficients extrmes du L-estimateur de position, celui-ci
savre peu robuste par rapport la moyenne.
- Nanmoins, le biais du L-estimateur de position reste trs faible.
- Le L-estimateur de dispersion est pour sa part beaucoup plus robuste et son biais est ngligeable.
Carte de position
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
Shewhart Carte L Xbb LSC LIC
Carte de dispersion
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
Carte L Carte S Ecart-Type Population LSC
Figure 68
Conclusion
Ltude ralise dans ce paragraphe nous a permis de vrifier que la faible robustesse du L-
estimateur de position ne constituait pas une entrave lutilisation de la carte L puisque les
modifications de la distribution de la population sont dtectes au mme titre que les autres causes
spciales. Notons dailleurs que le faible biais du L-estimateur de position a tendance favoriser
cette dtection. De plus, les modifications subies par la population sont ici particulirement
importante et peu vraisemblables sur un outils de production.
Loi N1 Loi N3
Ces rsultats et ceux obtenus par Pappanastos [Pap 96]
68
confirment en effet, que la robustesse dun
estimateur et la dtection danomalies de production par une carte de contrle sont antinomiques.
Nous avons vu au chapitre 2 que Lestimateur de Hodges-Lehmann qui se caractrise par une
grande robustesse fournit gnralement des rsultats mdiocres, lorsquil est employ pour une
carte de contrle. Le L-estimateur des moindres carrs, qui en revanche est peu robuste dtecte
rapidement les volutions de la population.
Nous rappelons donc la rgle de pilotage suivante :
Lorsque une tendance est dtecte la fois sur la carte de position et de dispersion (comme sur la
Figure 68), cela signifie que la distribution de la population a t modifie. Diffrentes actions sont
alors mettre en uvre :
- Arrter la production.
- Rechercher lorigine des causes spciales.
- Recalculer les coefficients du L-estimateur.
La non stationnarit des procds est un problme bien connu en automatique. Elle conditionne en
effet la validit des modles mathmatiques mis en uvre. Pour remdier cette non stationnarit,
on a souvent recours aux mthodes dites adaptatives , dont lobjectif est de prendre en compte
les volutions du procd pour que les modles mathmatiques utiliss restent acceptables.
Il serait intressant de pouvoir maintenir les coefficient du L-estimateur dans le voisinage des
valeurs qui assurent une estimation variance minimale et sans biais.
Une stratgie trs classique, par exemple, consiste recalculer priodiquement les coefficients
partir dune fentre de donnes limite dans le temps.
68
PAPPANASTOS E.A. & ADAMS B.M. Alternative Designs of Hodges-Lehmann Control Chart Journal of
Quality Technology Vol 28 N2 - 1996
Le cas particulier des dfauts de forme
Nous allons nous intresser dans ce paragraphe aux dfauts de forme, qui reprsentent une part
importante des non normalits rencontres dans le milieu industriel.
Le cas des dfauts de forme est a priori facile traiter puisque la distribution de la population est
parfaitement caractrise lorsquon connat le rapport m/ s o et o sont respectivement la
moyenne et lcart type de la loi de dfaut de forme. On peut donc saffranchir du calcul de la
matrice de variance covariance ainsi que du vecteur des moments dordre 1 pour dterminer les
coefficients du L-estimateur. On peut en effet imaginer que lon possde une base de donnes des
coefficients du L-estimateur, indexe par le coefficient m/ s et la taille dchantillon.
n=3
k=
z / s
z
C1 C2 C3
0.0 0.403632 0.223596 0.372771
0.1 0.406518 0.208337 0.385146
0.2 0.413629 0.197614 0.388757
0.3 0.407658 0.211248 0.381094
0.4 0.408133 0.200376 0.391490
0.5 0.418098 0.184483 0.397419
... ... ... ...
Figure 69
Rappelons que lutilisation du L-estimateur des moindres carrs, mme si cette mthode est non
paramtrique, suppose que la loi des observations peut tre dcrite par un modle non paramtrique
localisation chelle.
Dans le cas de la loi de dfaut de forme, ce modle nest pas valable car les deux paramtres
p
et
o
p
sont lis. Toute modification du paramtre de localisation de la population entrane une
modification du paramtre dchelle, du fait dune modification de la loi des observations.
Nous avons montr au paragraphe que la carte L tait particulirement sensible aux modifications
de la distribution de la population. Cela se traduit en particulier par une baisse de lefficacit du L-
estimateur et un lger biais.
Lobjectif dune carte de contrle tant de dtecter toute modification significative de la population,
il nest pas inintressant dutiliser une carte L dans le cas dun dfaut de forme, sous rserve que les
performances du L-estimateur soient nettement suprieures celles de la moyenne.
Choix des paramtres estimer
Nous avons justifi au paragraphe le choix du paramtre de localisation, en prenant pour critre, la
minimisation des cots de la non qualit. Dans le cas de tolrances unilatrales, Taguchi dfinit la
fonction perte par L=KX (Figure 70). Le paramtre de localisation ntant pas superposable la
cible, son choix nintervient pas dans la minimisation de la perte moyenne.

L=
K
n

i=1
n
X
i
2
=K (

X
2
+s
2
)
Eq 0
L
=
K
.X

0
Figure 70
On prendra donc de manire trs naturelle la moyenne de la loi de dfaut de forme comme
paramtre de localisation.
Variance du L-estimateur dans le cas des dfauts de forme
Avant de mettre en place une carte L, il est ncessaire de calculer la variance du L-estimateur pour
apprcier si son efficacit relative par rapport la moyenne justifie son utilisation.
Pour les dfauts de forme, nous nous intresserons particulirement au cas o le rapport m/ s est
proche de 0 puisquil caractrise une forte non normalit. En revanche, si le rapport m/ s tend vers
3, la loi de dfaut de forme est une loi normale.
Efficacit relative L-estimateur/ Moyenne
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1
1.01
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3
k
E
f
f n=3
n=4
n=5
n=6
Figure 71
Nous avons calcul avec Matlab les coefficients du L-estimateur des moindres carrs, par
intgration numrique (Eq 0 & Eq 0 p101). Ces rsultats nous ont permis de dterminer lefficacit
relative de la moyenne par rapport au L-estimateur de position (Figure 71).
On constate que la variance du L-estimateur est infrieure celle de la moyenne pour de faibles
dcentrages de la population, et quelle atteint son minimum pour un dcentrage de lordre dun
cart type. Lefficacit relative tend ensuite vers 1 pour k>2, puisque la distribution de la
population se rapproche de la loi normale.
Dun point de vu quantitatif, il faut admettre que lamlioration apporte par le L-estimateur en
terme de variance par rapport la moyenne est substantielle. En effet, celle-ci ne dpasse pas 5%
pour un chantillon de taille n=5, ce qui nentrane aucune amlioration sur la sensibilit dune
carte de contrle de type Shewhart
Conclusion
Les rsultats de notre tude tendent conclure que la carte L nest pas applicable au cas des dfauts
de forme.
En effet, lutilisation du L-estimateur des moindres carrs est particulirement dlicate dans le cas
des dfauts de forme, car toute volution de la moyenne entrane une modification de distribution
des observations. Le L-estimateur nest donc optimal que trs localement.
Dautre part, la variance du L-estimateur de position est sensiblement quivalente celle de la
moyenne. Il est donc plus intressant dutiliser une carte

X , qui pour des performances


quivalentes a lavantage dtre trs simple.
Extensions de la carte L
La carte L que nous avons propose dans la section prcdente nest pas la seule application
possible du L-estimateur des moindres carrs. Son application peut, en effet, couvrir un large
ensemble doutils, au mme titre que les estimateurs classiques de position et de dispersion.
Lun des outils majeurs dans lvolution moderne de la M.S.P. est la carte CUSUM pour sa grande
sensibilit aux faibles drives.
La carte CUSUM L
La carte CUSUM, ne se substitue gnralement pas la carte de Shewhart. On considre plutt
quelle complte ses applications. Alors que la carte de Shewhart est plutt destine aux procds
discrets, comme le montrent ses premires applications dans le milieu automobile, la carte CUSUM
est particulirement bien adapte aux procds continus. Les procds continus ont, comme leur
nom lindique, la particularit dvoluer de manire continue, de sorte quil est possible de dtecter
des tendances croissantes ou dcroisantes sur un critre tudi.
Le cartes CUSUM peuvent tre utilises partir de valeurs individuelles ou dchantillons. Nous
nous intresserons aux cartes construites partir dun chantillon, pour lesquelles, nous
substituerons L-estimateur de position moyenne.
Principe de la carte CUSUM-L
Le principe de la carte CUSUM est de faire le cumul des carts dune estimation par rapport la
valeur cible que lon sest fixe. Si le procd subit une drive, cela se rpercute par une
augmentation de la somme des carts.
Pour dtecter les drives la fois croissantes et dcroissantes, on utilisera deux sommes S
H
et S
L
,
respectivement haute et basse.
S
H
i
=Max
|
0, m( Cible+K)+S
H
i1

S
L
i
=Max
|
0, ( CibleK) m+S
L
i1

La valeur K, aussi appele filtre, est utilise pour limiter linfluence des faibles carts, qui
conduisent parfois la dtection dune drive alors que celle-ci est peu significative. K=k.o avec k
gnralement fix 0,5 pour dtecter un dcentrage dun cart type.
Les limites sont notes H telle que H=h.o
estimateur
. Les limites habituelles sont fixes partir de
lcart-type de la moyenne. Nous fixerons ici les limites en fonction de lcart type du L-
estimateur : H=h.o
L-estimateur
La variance du L-estimateur tant plus faible que celle de la moyenne, les sommes cumules ainsi
obtenues, seront moins pollues par la dispersion de lestimateur. La carte CUSUM-L a alors
lavantage vident de faire ressortir des tendances de manire beaucoup plus claire.
Exemple dapplication
Nous prsentons ici ltude dun procd dont la non normalit conduit un L-estimateur dont
lefficacit relative est de lordre de 0,85 (Figure 72). Cette amlioration en variance ne conduit
pas, en pratique, une carte L plus performante que la carte de Shewhart. En effet, nous avons vu
au paragraphe , que la P.O.M. de la carte L tait peu diffrente de celle dune carte de Shewhart
lorsque les limites sont places !3 s/ .n .
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Population Loi Normale
Figure 72
Nous avons donc cherch mettre en vidence les performances de la carte CUSUM-L par rapport
une carte CUSUM classique.
La Figure 73 prsente le suivi du procd laide dune carte de Shewhart. On constate ici que les
estimations effectues laide de la moyenne (n=5) et du L-estimateur de position sont
comparables. De plus, le suivi du procd sur 25 chantillons ne permet pas la dtection dun tat
hors contrle si lon sen tient aux rgles de pilotage nonces au . Le procd subit ici une drive
linaire. Au 25
me
chantillon le procd est dcentr de 0,5o.
-4
-3
-2
-1
0
1
2
3
4
1 3 5 7 9 11 13 15 17 19 21 23 25
Xb
L-estim
Tendance
Figure 73
Si on applique une carte CUSUM la mme srie de donnes, on constate sans surprise que la
drive du procd est dtecte (Figure 74). Le propre de la carte CUSUM tant en effet de dceler
les drives lentes.
Carte CUSUM standard
-6
-4
-2
0
2
4
6
8
10
1 3 5 7 9 11 13 15 17 19 21 23 25
SH SL
Figure 74
Malgr la faible amlioration en variance, du L-estimateur par rapport la moyenne, la carte
CUSUM-L savre plus sensible aux drives que la carte CUSUM standard (Figure 75).
Carte CUSUM-L
-6
-4
-2
0
2
4
6
8
10
1 3 5 7 9 11 13 15 17 19 21 23 25
SH SL
Figure 75
Lutilisation du L-estimateur des moindres carrs est donc particulirement intressante avec une
carte CUSUM mme pour des non normalits peu prononces.
P.O.M. de la carte CUSUM-L
Une tude de Priode Oprationnelle Moyenne ralise partir du mme exemple de population a
permis de vrifier la sensibilit de la carte CUSUM-L.
Les calculs ont t effectus par simulation pour des chantillons de taille n=5. Le nombre de
dtection a t fix 5000 pour tablir la P.O.M, soit 2,1.10
6
itrations pour une P.O.M. de 420.
Les limites sont places avec un coefficient h=5 et la valeur du filtre est k=0,5. Le dcentrage est
un multiple de lcart-type de la population.
Le trac de P.O.M. de la carte CUSUM-L est relativement simple interprter puisquil est
toujours infrieur celui de la carte CUSUM standard (Figure 76). Cela signifie que la dtection
dune drive par la carte CUSUM-L intervient toujours avant celle de la carte CUSUM standard
pour des risques o sensiblement quivalents (Figure 77). Nous avons pu montrer par ailleurs
(Chapitre 4) que les amlioration apporte par la carte CUSUM-L par rapport la carte CUSUM
standard sont dautant plus importantes que la non normalit est marque.
0
100
200
300
400
500
-1.0 -0.5 0.0 0.5 1.0
L-estimateur Moyenne
1.5
2.0
2.5
3.0
3.5
4.0
1.0 1.5 2.0
L-estimateur Moyenne
Figure 76

P.O.M. CUSUM-L P.O.M. CUSUM


0 420 480
0.1 140 162
0.2 39 48
0.3 18 21
0.5 7.8 8.6
1 3.2 3.6
1.5 2.1 2.3
2 1.8 1.9
Figure 77
Conclusion
La carte L que nous avons propose dans ce chapitre bnficie de la faible variance du L-estimateur
des moindres carrs. Cela permet notamment de dceler des drives avec beaucoup dacuit et
deffectuer des rglages de meilleure qualit sur le procd. Cependant ces avantages sestompent
trs rapidement si lefficacit relative du L-estimateur par rapport la moyenne nest pas
suffisante. On notera pour mmoire que la carte L ne nous semble pas dun grand intrt quand
lefficacit relative est suprieure 0,8. En effet, la faible amlioration par rapport la carte de
Shewhart, ne justifie pas un surcot de calculs.
La carte CUSUM-L, en revanche est plus sensible que la carte CUSUM standard, mme dans le cas
o le L-estimateur est peu efficace.
Son intrt est donc dtendre le domaine dapplication des cartes de contrle construites partir
dun L-estimateur. De plus, cette carte particulirement sensible aux drives peut permettre de
dtecter dventuelles volutions de la distribution de la population.
La carte CUSUM-L nest bien entendu pas la seule extension possible de la carte L. On peut
effectivement envisager dapplique le L-estimateur des moindres carrs des cartes de type
EWMA.
Conclusions et perspectives
Une approche gnraliste
Loriginalit de notre tude rside essentiellement dans une approche non paramtrique des
problmes destimation de position et de dispersion dune population partir dun chantillon de
faible taille. Lapproche non paramtrique permet en effet de saffranchir de lhypothse de
normalit souvent peu justifie. Le modle localisation chelle , utilis dans notre tude, permet
en effet de dcrire un large ventail de distributions qui se caractrisent par un paramtre de
localisation et un paramtre dchelle.
Lestimateur que nous proposons, pour la construction dune nouvelle carte de contrle a la
particularit de pouvoir estimer dautres paramtres de localisation que la moyenne ou la mdiane.
Ces paramtres, le plus souvent utiliss par dfaut, ne sont pas forcment les meilleurs.
Nous avons montr, que lon pouvait dterminer ce paramtre de localisation en minimisant le
critre du cot de non qualit au sens de Taguchi.
Nous avons montr que le paramtre de localisation optimal est la moyenne de la population
lorsque la fonction perte est symtrique. Dans le cas contraire, le choix du paramtre de localisation
dpend de la densit de loi de la population, ce qui rend le paramtre difficile dterminer
exprimentalement.
Avantages de la carte L
La carte L que nous avons prsent dans ce chapitre est construite partir du L-estimateur des
moindres carrs introduit par Lloyd en 1952. Cet estimateur a la particularit de fournir des
estimations sans biais dun paramtre de localisation et dun paramtre dchelle de la population.
Cest aussi un estimateur optimal en terme de variance parmi les estimateurs construits partir
dune combinaison linaire des observations.
Les rpercussions de cette faible variance sur la carte L sont notamment de fournir un trac moins
bruit que la carte de Shewhart, de telle sorte que les rgles de pilotage bases sur la mise en
vidence de tendances sont plus faciles appliquer.
De plus la P.O.M de la carte L est toujours trs infrieure celle de la carte Shewhart lorsque les
limites sont places
!3 s
Lestimateur
. La sensibilit de la carte L aux dcentrages est donc plus
grande que celle de la carte de Shewhart. Cet avantage peut aussi savrer un inconvnient lorsque
les risques o sont trop grands. Les risques o sont en effet souvent de lordre 2%, ce qui peut
apparatre inacceptable pour certains utilisateurs. On peut donc choisir de minimiser ces risques en
prenant des limites plus larges !3 s/ .n .
Nous avons galement propos une extension de la carte L, appele CUSUM-L, qui consiste
appliquer une procdure CUSUM des estimations provenant du L-estimateur des moindres carrs.
La carte CUCUM-L a lintrt dtre plus sensible aux faibles drives que la carte CUSUM
propose par Page [Pag 54]
69
.
69
PAGE E. S. Continuous Inspection Schemes - Biometrics - Vol 41 - 1954
Cette proprit est dautant plus intressante quelle est toujours valable lorsque les performances
du L-estimateur sont mdiocres par rapport la moyenne.
Mise en uvre
Afin de faciliter la mise en uvre de la carte L nous avons propos deux procdures de dmarrage.
Le dmarrage par lissage des coefficients du L-estimateur permet un passage progressif de la
moyenne vers les coefficients optimaux, au fur et mesure de lapprentissage du procd. Cette
procdure est plus particulirement destine aux sries longues car elle exige un minimum de 30
chantillons pour que les coefficients du L-estimateurs soient correctement estims.
La seconde procdure sappuyant sur une mthode bootstrap est plus particulirement destine aux
sries courtes ou aux procds volution rapide. Son principe repose sur la constitution dune
population empirique, partir de laquelle on construit les coefficients du L-estimateur par
rchantillonnage. Le nombre dobservations ncessaires au calcul des coefficients peut ainsi tre
rduit une trentaine, ce qui est particulirement intressant lorsque le procd est peu stable.
Les limites de la carte L
Lutilisation de mthodes non paramtriques ne signifie pas que ces mthodes sont universelles. En
effet, les modles postuls, mme trs larges ne peuvent satisfaire toutes les situations. Ainsi le
modle localisation chelle, utilis pour le L-estimateur des moindres carrs nest pas valable pour
les lois de type dfaut de forme puisque tout dcentrage du procd entrane une modification de la
distribution de la population. Les paramtres de localisation et dchelle nont donc plus la mme
signification lorsque la distribution de la population volue.
Perspectives
Ce problme est aussi rencontr pour des critres diffrents des dfauts de forme. On suppose par
exemple que les caractristiques de la distribution des observations voluent pour une raison
quelconque. Une bonne utilisation de la M.S.P. veut que ce phnomne soit dtect car nous avons
eu loccurrence dune cause spciale. Nous avons vu au paragraphe que ce type dvolution tait
parfaitement dtectable laide dune carte L. Cependant, dans de telles condition les performances
en variance du L-estimateur chutent de manire importante. Pour augmenter nos chances de
dtecter les modifications de la distribution de la population, il peut tre intressant de mettre en
place une procdure adaptative, de sorte que les coefficients du L-estimateur garantissent des
performances optimales.
Chapitre 4
Chapitre 4
Application Industrielle de la carte L
Pr-requis lapplication dune carte L
Depuis sa cration, la M.S.P. sest enrichie dun nombre important doutils largissant le domaine
des applications de la carte

X /R. Ces outils souvent trs spcialiss, comme les cartes de contrle
multidimensionnelles ou les cartes petites sries, ncessitent une parfaite adquation avec le
problme trait pour que leur application soit couronne de succs.
Chacun des outils de la M.S.P. a des spcificits la fois statistiques et mthodologiques, qui le
rendent plus ou moins apte piloter une famille de procds. En effet, on utilisera plus volontiers
une carte aux valeurs individuelles sur un procd continu de lindustrie chimique, que sur un
procd discret de lindustrie mcanique.
Ainsi, nous allons prciser le cadre dapplication de la carte L ainsi que les conditions opratoires
qui garantissent des performances intressantes.
Les procds tudis
Ltude des procds non normaux nous a permis dextraire deux grandes familles de non
normalits :
- Les non normalits qui proviennent de la structure du procd. Cest--dire les procds qui
possdent plusieurs causes de dispersion dominantes.
- Les non normalits lies au type de critre tudi. Les critres unilimites tels que les dfauts de
forme ou les critres de position qui suivent une loi de Rayleigh par exemple.
Nous avons montr au chapitre 3 que le L-estimateur des moindres carrs ne pouvait tre utilis
efficacement dans le cas de critres unilimites car, dans ce cas, le modle localisation chelle nest
pas valide. Toute modification de la dispersion du procd ou de son centrage entrane en effet une
modification de la distribution de la population. Par suite, le L-estimateur des moindres carrs
fournit des estimations biaises des paramtres de localisation et dchelle.
Le modle localisation chelle est en revanche bien adapt la reprsentation de distributions
stratifies. Lutilisation de la carte L pour le suivi de procds de type multignrateurs est donc
particulirement conseille. Cependant, pour que la mise en uvre de la carte L soit rellement
profitable, il est recommand de restreindre son domaine dapplication des populations dont la
non normalit est relativement marque. Dans le cas de faibles non normalits, la moyenne offre
des estimations dont la variance est trs proche des bornes de Frchet.
La mthode dchantillonnage
La procdure dchantillonnage possde un aspect thorique important pour les mthodes
destimation statistiques par sondage. Son choix conditionne en effet la prcision et la validit des
rsultats. De plus, elle revt un aspect pratique et conomique primordial pour les utilisateurs de la
M.S.P. puisque les contraintes des cadences de production ou de lots, ne permettent pas toujours de
mettre en place les mthodes dchantillonnage les plus efficaces.
Nous avons prsent au chapitre 2 un certain nombre de mthodes dchantillonnage dont les
performances et les applications sont parfois trs diffrentes. Parmi celles-ci, nous avons retenu
quatre mthodes incontournables dans les applications industrielles :
- La plus connue dentre elles est bien entendu lchantillonnage alatoire que lon pratique
notamment en contrle rception. Cette mthode est la plus simple car elle ne tient pas compte
dune ventuelle stratification de la population. On lutilisera de prfrence pour des procds
non stratifis, cependant sa simplicit peut motiver son utilisation dans dautres situations.
- Lchantillonnage squentiel, sapplique exclusivement aux procds stratifis. Il a lavantage
de rduire la variance des estimations par rapport lchantillonnage alatoire du fait dune
rduction de la variance inter chantillons. Cette procdure est particulirement adapte aux
procds tels que les multibroches o les observations proviennent successivement de strates
diffrentes.
- Un cas particulier de lchantillonnage squentiel est celui o la taille des chantillons est gale
au nombre de strates. Dans ce cas lchantillon est dit reprsentatif puisque lon a une
observation par strate. Cette mthode est la plus efficace des trois mais aussi la plus
contraignante car elle ncessite une distinction physique des diffrentes strates.
- Le prlvement dun chantillon reprsentatif est particulirement intressant car il rduit
fortement la variance inter chantillons. Dans le mme tat desprit, on peut prlever
systmatiquement des observations sur des strates dfinies lavance. Lavantage de cette
dmarche est de pouvoir fournir des estimations faible variance tout en prlevant des
chantillons conomiquement viables. Cependant cette approche occulte linformation provenant
des autres strates de la population, et par consquent ne pourra dtecter un ventuel accident sur
les strates non surveilles.
Le choix de ces mthodes est gnralement dict par le type de procd piloter. Dans chacun de
ces cas, on peut utiliser la moyenne ou le L-estimateur pour estimer le paramtre de position de la
population. Les coefficients du L-estimateur ainsi que sa variance seront bien entendu diffrents
selon la mthode dchantillonnage retenue.
Cependant lutilisation du L-estimateur de position, reste intressante pour chacune des mthodes
prsentes puisque ses performances en terme de variance sont meilleures ou gales celles de la
moyenne.
En outre, rappelons quil est possible doptimiser les prlvements au sein dune strate. Cet
chantillon appel chantillon de Neyman tient compte de la dispersion de chacune des strates de la
population. Un chantillon reprsentatif peut tre un chantillon de Neyman si la dispersion de
chacune des strates est dun mme ordre de grandeur. Dans le cas particulier o les chantillons
prlevs sont des chantillons de Neyman on peut remarquer que le L-estimateur de position est la
moyenne. La moyenne est donc lestimateur variance minimale parmi les estimateurs linaires.
Dans ce cas, il est vident que le calcul du L-estimateur a peu dintrt.
Exemple
Pour illustrer notre propos, nous avons calcul la variance du L-estimateur de position et de la
moyenne pour lchantillonnage squentiel et lchantillonnage alatoire. Ces calculs ont t
raliss pour une population constitue de six strates (Voir chapitre 3).
N(5, 1), N(5, 1), N(5.5, 1), N(0, 1), N(-3.2, 1), N(-3.5, 1)
Dans ce cas, lchantillon de Neyman est lchantillon reprsentatif puisque les strates ont la mme
dispersion.
Echantillonnage Alatoire
Echantillon n = 3 n = 4 n = 5 n = 6 n = 7 n = 8 n = 9 n = 10
L-estimateur
4.29 2.46 1.52 1.01 0.72 0.55 0.44 0.36
Moyenne 5.32 3.99 3.19 2.66 2.28 2.00 1.77 1.60
Efficacit relative 0.81 0.62 0.48 0.38 0.32 0.28 0.25 0.22
Echantillonnage Squentiel
Echantillon n = 3 n = 4 n = 5 n = 6 n = 7 n = 8 n = 9 n = 10
L-estimateur m
0.49 0.45 0.33 0.17 0.20 0.20 0.14 0.16
Moyenne 1.02 1.31 0.80 0.17 0.45 0.39 0.30 0.34
Efficacit relative 0.48 0.34 0.41 1 0.44 0.51 0.47 0.47
Figure 78
0
0.2
0.4
0.6
0.8
1
3 4 5 6 7 8 9 10
n
V
a
r
i
a
n
c
e
Alatoire
Squentiel
Figure 79
A la lumire de cet exemple, nous constatons, que pour lchantillonnage squentiel, lefficacit
relative du L-estimateur par rapport la moyenne ne dpend pas de la taille dchantillon,
contrairement lchantillonnage alatoire. Dautre part, on vrifie bien que la moyenne et le L-
estimateur ont la mme variance quand on prlve lchantillon de Neyman.
Dans lexemple propos, on peut ramener le nombre de strates cinq puisque deux dentre elles on
la mme moyenne :
N(5, 2), N(5.5, 1), N(0, 1), N(-3.2, 1), N(-3.5, 1)
Lchantillon de Neyman est alors le mme que prcdemment puisquon prlvera deux
observations sur la premire strate et une seule pour chacune des autres strates.
Les besoins informatiques
Ncessit dun outil informatis
Le succs de la mise en place de la M.S.P. tient essentiellement la motivation du personnel
dencadrement et limplication des oprateurs dans le processus damlioration de la qualit.
Cependant, le surplus de travail quoccasionne ces mthode est souvent une cause de dmotivation.
Ainsi loutil informatique est devenu une ncessit pour bon nombre dutilisateurs de la M.S.P.
Nous ne considrons en aucun cas que linformatisation est la cl de la russite pour la mise en
uvre de la M.S.P. Cependant elle peut y contribuer trs largement pour les diffrentes raisons que
nous nonons ci-dessous :
Du point de vue de loprateur
Les frquences de contrle sont trs leves.
Le nombre de critres suivis est important.
Les calculs sont complexes (carte CUSUM, carte Petite Srie, etc. )
Pour la dmarche qualit
Le volume de donnes est important. Linformatique permet une analyse synthtique des
donnes de production et facilite leur archivage.
La lourdeur des calculs ncessaire la construction du L-estimateur des moindres carrs justifie
elle seule lutilisation de linformatique. En effet le calcul des coefficients du L-estimateur des
moindres carrs requiert la construction de la matrice de covariance des statistiques dordre
rduites, ainsi que son inversion.
De plus, les algorithmes de rchantillonnage de type bootstrap nont aucun intrt s'ils ne sont pas
informatiss.
Notre objectif tant de valider la carte L dans une approche industrielle, nous avons dvelopp une
maquette informatique permettant le pilotage du procd par cartes L.
Prsentation de la maquette informatique
Nous allons prsenter brivement les fonctionnalits dveloppes dans ce logiciel pour exploiter au
maximum les possibilits des cartes L et CUSUM L.
La maquette ralise se compose de quatre modules qui sarticulent autour dune base de donnes.
Les fonctionnalits des diffrents modules sont :
- La spcification de la gamme de contrle du critre tudi : Cible, cart-type de la population,
mode de calcul des limites de contrle, mthode de dtermination des coefficients du L-
estimateur.
- Le calcul des coefficients du L-estimateur par mthode bootstrap ou par simulation de Monte
Carlo.
- Lanalyse de capabilit machine et de capabilit procd.
- Le pilotage par carte de contrle et la saisie de nouvelles donnes.
Dfinition du procd
La premire tape de dfinition du procd est de
saisir les donnes relatives au critre surveill.
- La cible du procd
- La dispersion instantane du procd
- Les tolrances de critre.
On dfinit galement le mode de calcul des limites.
Autrement dit, on prcise si les limites sont fixes
ou recalcules priodiquement.
Dfinition du mode de calcul du L-estimateur

La deuxime tape importante consiste
dterminer la mthode de calcul des coefficients
du L-estimateur.
Si la distribution de la population est
parfaitement connue, il est possible de fixer ces
coefficients et de les saisir manuellement.
De manire plus gnrale, la distribution des
observations ntant pas connue a priori, on a le
choix entre :
- Le calcul des coefficients par mthode
bootstrap partir dune distribution
empirique.
- Le calcul des coefficients partir des
chantillons prlevs pour le pilotage par
carte de contrle. Nous avons vu au chapitre 3
quil tait intressant dappliquer une mthode de lissage pour pondrer progressivement les
estimations du L-estimateur au fur et mesure que les coefficients convergent vers les
coefficients optimaux.
- Le calcul des coefficients par simulation de Monte Carlo, qui suppose la connaissance des
caractristiques de la loi de distribution des observations. Nous navons programm que le cas de
mlanges de lois normales.
Exemples dapplication
Les applications prsentes dans ce chapitre concernent lindustrie du dcolletage et de la
plasturgie. Ce choix qui peut apparatre restrictif a t influenc par lactivit conomique
rgionale. De plus ces secteurs dactivit rencontrent frquemment des cas typiques de non
normalit auxquels nous nous intressons.
Les activits du dcolletage et de la plasturgie sont, en effet, trs largement implantes dans la
rgion Rhne-Alpes. En outre ces industries ont consenti des efforts considrables pour dvelopper
une politique de qualit totale, sous limpulsion de leurs clients, qui sont bien souvent des
constructeurs automobiles. Leur connaissance des mthodes de la M.S.P. ainsi que lexistence
dune structure de contrle qualit ont t un atout important pour la russite de notre tude.
La plasturgie
Lindustrie de la plasturgie possde un nombre important de techniques de mise en forme du
plastique : le thermoformage, le moulage par transfert, injection, ou projection. Parmi ces
techniques, nous nous sommes particulirement intresss aux presses injecter qui comptent
parmi les procds les plus classiques de la plasturgie. Ces procds permettent de fabriquer des
formes pleines par injection de plastique dans un moule. Pour des raisons de rentabilit videntes,
on utilise le plus possible des moules comportant plusieurs empreintes : les multi-empreintes.
Moule
Injection
de
Plastique
Figure 80
Les deux paramtres prpondrants du process dune presse injecter sont la temprature du
plastique et la pression dinjection. Nanmoins une parfaite matrise de ces paramtres ne suffit pas
obtenir des pices identiques. En effet, une parfaite homognit de la production suppose que les
empreintes soient strictement identiques et que la matire premire soit rpartie de manire
quivalente entre elles. Ces deux raisons expliquent elles seules que ces procds sont
particulirement non normaux.
Etude dune presse injecter 8 empreintes
Notre premire tude a t ralise dans lentreprise ID, spcialise dans la fabrication de pices
plastiques de petites tailles pour les composants lectroniques ou la connectique. La fabrication de
pices de prcision ncessite un soin particulier pour llaboration des moules.
Prsentation du procd de fabrication
Le procd que nous avons tudi comporte 8 empreintes et fabrique des connecteurs lectriques.
Nous avons suivi lune des cotes critique de cette pice, qui est une surpaisseur permettant doffrir
une rsistance mcanique lors de lenfichage ou le retrait du connecteur.
Schma du connecteur
5.38 0.05mm
Analyse de variance
Nous avons tout dabord ralis une analyse de variance pour chacune des empreintes du moule,
afin de vrifier de manire rigoureuse la non normalit du procd. Pour cela nous avons prlev 10
mesures par empreinte.
Lobjectif de lanalyse de variance est de dterminer si la variabilit lie aux diffrents facteurs
(empreintes) est significative par rapport la dispersion imputable aux facteurs non contrls,
cest--dire les causes communes.
Facteurs 1 2 3 4 5 6 7 8 9 10
X

i=1
10
(
X
i

X
)
Empreinte 1 5.388 5.387 5.384 5.385 5.387 5.387 5.389 5.389 5.386 5.387 5.3869 2.29E-5
Empreinte 2 5.385 5.388 5.385 5.385 5.384 5.383 5.386 5.388 5.385 5.384 5.3853 2.41E-5
Empreinte 3 5.38 5.382 5.381 5.382 5.382 5.38 5.38 5.378 5.381 5.38 5.3806 1.44E-5
Empreinte 4 5.387 5.386 5.387 5.385 5.385 5.388 5.387 5.388 5.386 5.389 5.3868 1.56E-5
Empreinte 5 5.383 5.386 5.385 5.384 5.382 5.384 5.385 5.382 5.383 5.384 5.3838 1.56E-5
Empreinte 6 5.383 5.378 5.379 5.381 5.375 5.381 5.38 5.377 5.378 5.379 5.3791 4.69E-5
Empreinte 7 5.388 5.386 5.389 5.384 5.387 5.387 5.385 5.389 5.39 5.385 5.387 3.60E-5
Empreinte 8 5.386 5.384 5.386 5.384 5.385 5.386 5.387 5.385 5.385 5.387 5.3855 1.05E-5

X
E
5.3844 1.86E-4
des carrs
ddl Variance Fexprience Fthorique
Facteurs 6.37E-04 7 9.10E-05 35.21 2.14
Rsidus 1.86E-04 72 2.58E-06
Total 8.23E-04 79
Figure 81
Le rsultat de cette tude nous montre que le rapport entre la variance inter chantillon et la
variance rsiduelle
V
A
/V
R
=F
exp rience
, est trs suprieur F
thorique
que lon trouve dans la table de
la loi de Snedecor en fonction des paramtres v
A
= 7 v
R
= 72 et o=5%
On conclut donc que linfluence des facteurs est significative. Cest--dire que la stratification de la
population est importante.
Distribution de la population
Si on calcule la variance et la moyenne de chacune des empreintes, en supposant que chacune des
empreintes gnre une loi normale, on peut avoir une ide de la distribution de la population
(Figure 82).
Empreinte 1 2 3 4 5 6 7 8
Moyenne 5.3869 5.3853 5.3806 5.3868 5.3838 5.3791 5.387 5.3855
Ecart-type 0.00159 0.00164 0.00127 0.00132 0.00132 0.00228 0.00200 0.00108
Figure 82
On vrifie tout dabord par un test de Hartley si les carts entre la variance des empreintes sont
significatifs (Eq 0) :
r=
V
max
V
min
=4 . 458 . 95
avec o=5%
Eq 0
La ratio entre la variance maximum et la variance minimum tant infrieur la valeur fournie dans
un tableau en fonction de la taille des chantillons (ici n=10), le test conclut que lcart les
variances nest pas significatif. On peut donc considrer que toutes les empreintes ont la mme
variance pour obtenir la distribution Figure 83.
Distribution de la population
5.373 5.377 5.381 5.385 5.389 5.393
Figure 83
Calcul des coefficients du L-estimateur
Notre priode dtude tant limite dans le temps, nous avons choisi de calculer les coefficients du
L-estimateur par la mthode bootstrap partir de 30 observations. Nous pouvons constater sur la
courbe ci-dessous, que les coefficients obtenus sont trs proches de ceux calculs par une mthode
de Monte Carlo partir de la distribution Figure 83. Cela signifie dans ce cas que lhypothse de
normalit de la distribution des empreintes est tout fait valable.
Ces deux mthodes diffrent en effet par leur manire de gnrer des donnes. Alors que la
mthode bootstrap est une mthode de rchantillonnage partir de donnes prleves sur le
procd, la simulation de Monte Carlo que nous avons mene suppose la connaissance du nombre
de gnrateurs et de leurs lois respectives.
Fonction de poids du L-estimateur de position
-0.1
0
0.1
0.2
0.3
0.4
0.5
0 0.25 0.5 0.5 1
u
J
(
u
)
Bootstrap Simulation
Figure 84
Calculons maintenant lefficacit relative du L-estimateur de position par rapport la moyenne
pour un chantillon deffectif n=5. Lcart-type
si
i
est calcul partir de la population empirique
de la procdure bootstrap car cest partir de cette population que lon dtermine les coefficients du
L-estimateur ainsi que les paramtres de localisation et dchelle o estimer.
- Variance du L-estimateur de position pour un chantillon deffectif n=5
Var ( m)=s
2
i

t
D
det ( A
t
D
1
A)
= 1,15.10
-6
- Variance de la moyenne
Var (

X )=
s
2
i
.n
=1, 7210
6
i
Do une efficacit relative (Eq 0) intressante.
ER(

X , m)=
Var ( m)
Var (

X )
0 . 67
Eq 0
Suivi du procd par carte L
Pour piloter le procd, nous avons effectu des prlvements de 5 pices de manire alatoire tous
les quarts dheure.
Les tracs de la carte de Shewhart et de la carte L sont reprsents Figure 85. On constate que le
procd drive lentement. Toutefois cette drive ne peut donner lieu une action corrective pour les
raisons suivantes :
- Aucun point ne dpasse les limites de contrle,
- on ne peut compter que 6 points au-dessus de la cible,
- on a alternativement des squences de points croissantes ou dcroissantes.
Lamlioration apporte ici par la carte L est assez sensible puisque son trac est un peu moins
mouvement que celui de la carte de Shewhart. Le point N 10 est trs proche de la limite
suprieure, ce qui peut amener loprateur intervenir sur le procd.
Carte de Shewhart
5.375
5.377
5.379
5.381
5.383
5.385
1 2 3 4 5 6 7 8 9 10 11
LC(Xb)
mu
Xb
LC(mu)
m
5.3785 5.3794 5.3804 5.3791 5.3793 5.3820 5.3826 5.3807 5.3809 5.3830 5.3811

X
5.3784 5.3799 5.3809 5.3785 5.3799 5.3827 5.3829 5.3809 5.3801 5.3825 5.3813
Figure 85
Etant donn que le procd drive de manire lente, nous avons considr que le suivi par une carte
CUSUM tait mieux adapt ce type de configuration.
Pilotage par carte CUSUM-L
Les Figure 86 et Figure 87 reprsentent respectivement les tracs de la carte CUSUM standard et la
carte CUSUM-L pour la mme squence de donnes que prcdemment (Figure 85).
Les cartes CUSUM ont t calcules avec les paramtres suivants :
CUSUM CUSUM-L
Ecart type de
lestimateur
1,31.10
-3
1,07.10
-3
Filtre k= 0.5 k=0.5
Limites de contrle h= 5 h= 5
Carte CUSUM
-0.008
-0.006
-0.004
-0.002
0
0.002
0.004
0.006
0.008
1 2 3 4 5 6 7 8 9 10 11
LSC
SH
SL
LIC
SH 0 0 0.00024 0 0 0.00204 0.00429 0.00453 0.00398 0.00582 0.00647
SL -0.00084 -0.00029 0 -0.00084 -0.00029 0 0 0 0 0 0
Figure 86
Carte CUSUM-L
-0.006
-0.004
-0.002
0
0.002
0.004
0.006
0.008
1 2 3 4 5 6 7 8 9 10 11
LSC
SH
SL
LIC
SH 0 0 0 0 0 0.00151 0.00362 0.00382 0.00424 0.00674 0.00735
SL -0.00087 -0.00087 0 -0.00035 -0.00049 0 0 0 0 0 0
Figure 87
On constate ici que la carte CUSUM-L est plus sensible que la carte CUSUM standard puisque la
drive du procd est mise en vidence au 10
me
point alors que la carte CUSUM standard ne fait
que sapprocher de la limite au 11
me
point. Ceci na rien de surprenant car nous avions montr au
chapitre 3 que la P.O.M. de la carte CUSUM-L convergeait plus rapidement vers 1 que celle de la
carte CUSUM standard lorsque le dcentrage augmente.
Etude dune presse injecter 4 empreintes
Les donnes collectes pour cet exemple proviennent dun sous-traitant dun fabricant de fixations
de skis. La presse injecter tudie comporte quatre empreintes et les pices fabriques sont des
pistons pour le talon dune fixation de ski.
30.30
+0.0/-0.30
Etude prliminaire.
Afin de dterminer la cote tudier, nous nous sommes bass sur une tude de capabilit
antrieure. Il ressort de cette tude que la longueur du piston suit une distribution stratifie. Ltude
de capabilit a t ralise indpendamment sur chacune des empreintes en prlevant 30 mesures.
Moyenne Ecart type
Empreinte N1 30.224 0.0101
Empreinte N2 30.169 0.0090
Empreinte N3 30.134 0.0081
Empreinte N4 30.167 0.0069
Figure 88
Les rsultats sont assez significatifs et il nest pas besoin deffectuer une analyse de variance pour
conclure que linfluence des empreintes est significative. En effet le trac (Figure 89) laisse paratre
une forte stratification de la population.
Distribution des observations
30.105 30.155 30.205 30.255
Figure 89
Coefficients du L-estimateur
La distribution de la population tant platikurtique, la fonction de pondration du L-estimateur de
position a une forme en U qui se rapproche du milieu de ltendue.
En effet, les coefficients calculs par la mthode bootstrap partir de 30 observations sont assez
proches de 0.5 aux extrmes. Le mme calcul ralis par simulation nous donne en revanche une
fonction de pondration qui oscille un peu plus autour de la moyenne.
Cette diffrence sexplique bien entendu par la lgre diffrence entre la distribution obtenue par
ltude de capabilit et la distribution de la population empirique, utilise pour la procdure
bootstrap.
Fonction de poids du L-estimateur de position
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
0 0.25 0.5 0.75 1
u
J
(
u
)
Bootstrap Simulation
La forte non normalit de la population nous permet dobtenir un L-estimateur de position
relativement performant, comme le montre le calcul de lefficacit relative du L-estimateur par
rapport la moyenne :
Var ( m)= 1,31.10
-4
Var (

X )= 2,44.10
-4
do lefficacit relative : ER(

X , m)=0 . 541
Ces valeurs sont obtenues en prenant lcart-type de la population empirique o
p
comme
approximation de lcart type de la population.
Pilotage par Carte L
Pour construire la carte L nous avons pris comme cible le milieu de lintervalle de tolrance.
Les chantillons sont prlevs alatoirement par groupe de 5.
Les limites de contrle la carte de Shewhart sont respectivement calcules par :
Carte

X Carte L
Formule
Cible!3
s
p
i
.n
i
Cible!3 s
Lestimateur
LSC 30.197 30.184
LIC 30.103 30.116
Carte L et Carte Xb
30.10
30.12
30.14
30.16
30.18
30.20
1 2 3 4 5 6 7 8 9 10 11 12 13
LC(mu)
Mu
Moyenne
LC(Xb)
m
30.161 30.154 30.161 30.132 30.154 30.156 30.172 30.169 30.173 30.176 30.171 30.164 30.191

X
30.153 30.156 30.149 30.138 30.151 30.156 30.159 30.189 30.179 30.174 30.157 30.163 30.197
Figure 90
La Figure 90 prsente lvolution du procd selon la carte L et la carte de Shewhart.
Bien que la dtection dun point hors contrle soit faite simultanment sur les deux cartes de
contrle, la carte L fournit, un trac beaucoup moins perturb ce qui permet dextraire la tendance
du procd plus aisment.
Supposons par exemple que lon applique la rgle de pilotage qui consiste compter le nombre de
points conscutifs dun ct de la cible. La valeur du rglage appliquer au procd apparat de
manire vidente sur la carte L.
On calcule la moyenne des estimations du point N5 au point N11.

i=5
11
m
i
7
=
30.1679

i=5
11

X
i
7
=
30.1671
La rgle de pilotage veut que le rglage effectu soit de la valeur de lcart entre la tendance
moyenne et la cible. On peut avoir une ide de la prcision du rglage effectu en calculant lcart
type des estimations de la position du procd, partir des point N5 N11.
En calculant le rapport
R=
R glage
s
Estimation
(une sorte de rapport Signal/Bruit) on peut donc caractriser
lefficacit du rglage effectu. Plus cette valeur est grande, plus on peut considrer que le rglage
est fiable. Une valeur de R infrieure 2 est en revanche le signe dun rglage peu fiable.
Rglage prconis Prcision R
m
Cible -

i=5
11
m
i
7
=
-0.01798
.
1
7

i=5
11
(
m
i

m
)
2
7
=0.0030
5.99

X
Cible -

i=5
11

X
i
7
=
-0.01714
.
1
7

i=5
11
(

X
i

X
)
2
7
=0.0050
3.43
Figure 91
La comparaison ralise Figure 91 montre, comme on pouvait sy attendre, que les rglages
effectus laide de la carte de Shewhart sont moins prcis que ceux raliss partir de la carte L.
La faible variance du L-estimateur de position permet en effet dobtenir une valeur de R beaucoup
plus leve que dans le cas de la moyenne.
Carte CUSUM-L
Pour complter notre tude, nous avons calcul les cartes CUSUM pour la srie de donnes tudie
prcdemment, afin de vrifier si le dcentrage du procd est dtect.
Carte CUSUM
-0.1
-0.05
0
0.05
0.1
0.15
1 2 3 4 5 6 7 8 9 10 11 12 13
LSC
SH
SL
LIC
SH 0 0 0 0 0 0 0.0021 0.0343 0.0564 0.0726 0.0727 0.0789 0.1190
SL 0 0 0 -0.004 0 0 0 0 0 0 0 0 0
Figure 92
Dans ce cas, la carte CUSUM ne dtecte pas plus rapidement le dcentrage que dans le cas de la
carte de Shewhart. Mme si, il est vrai, les points sont trs proches de la limite suprieure partir
du 10
me
point, celles-ci ne sont franchies quau 12
me
chantillon.
Avec la carte CUSUM-L, le procd est hors contrle ds le 10
me
point, ce qui est un peu mieux
que la carte de Shewhart lorsque lon utilise la rgle de pilotage des tendances.
Carte CUSUM-L
-0.1
-0.05
0
0.05
0.1
0.15
1 2 3 4 5 6 7 8 9 10 11 12 13
LSC
SH
SL
LIC
Figure 93
Les deux tudes ralises dans la plasturgie ont montr que la carte L pouvait avoir un grand intrt
pour le pilotage de procds multi-empreintes, et notamment sur des cotes critiques lorsque la
capabilit machine nest pas trs grande.
Lindustrie du dcolletage
Lindustrie du dcolletage implante massivement dans la valle de lArve travaille essentiellement
pour le secteur automobile. Les procds utiliss pour la fabrication de pices cylindriques sont
pour la plupart des tours. Le plus utilis dentre eux est sans doute le tour multibroches, dont
lintrt est de pouvoir raliser plusieurs oprations (6 ou 8) en un cycle. Nous nous sommes donc
intresss lune de ces productions
Outil
Pice usiner
Broches
Plateau
Figure 94
Etude dun tour multibroches 6 broches
Le critre que nous avons choisi dtudier est une longueur 5.25mm sur une pice de dcolletage.
Le contrle est ralis laide dun manchon.
5.25 0.1
Bute
Capteur Inductif
Figure 95
Dans le cadre de cet exemple, les donnes ont t recueillies laide dun terminal datelier PAT
600

.
Etude prliminaire
Conformment aux procdures tablies, nous avons ralis un prlvement de 30 pices sur une
priode de production trs courte pour calculer la capabilit machine. Les rsultats obtenus rvlent
une trs bonne capabilit machine (Figure 96).
Moyenne 5.267
Ecart-type 0.00974
Tolrance
Suprieure
5.35
Tolrance Infrieure 5.15
Cm 3.42
Cmk 2.83
Figure 96
La construction dun histogramme et le calcul du test du _
2
laissent supposer que la distribution des
observations suit une loi normale. Cependant il faut garder lesprit que le test du _
2
conclut trs
souvent la normalit dune distribution lorsque le nombre dobservations est faible. _
2
observ
=
1.589 < _
2
Thorique
= 5.991
En outre le test de Kolmogorov confirme ce rsultat (Figure 97).
Histogramme
0
1
2
3
4
5
6
7
8
9
10
5.232 5.248 5.265 5.281 5.297
Mesures Courbe Thorique
Test de Kolmogorov
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
F(x)-Dn Frquences F(x)+Dn
Figure 97
Il faut nanmoins admettre, aux vues des rsultats que la distribution des observations ne peut tre
que faiblement non normale
Calcul des coefficients du L-estimateur
Les oprateurs semblent ne pas se soucier de lordre des pices lorsquelles sont jectes du tour.
Plutt que de prlever six pices conscutives la sortie de la machine, ils prlvent les pices dans
le bac de rception. La premire mthode a pourtant plusieurs avantages :
- Les observations constituent un chantillon reprsentatif.
- Les observations tant conscutives, le procd est suppos stationnaire et on minimise les effets
dventuelles drives.
- Les observations provenant des derniers cycles dusinage, on amliore la ractivit en cas de
rglage.
Lchantillonnage tant alatoire nous dcidons de calculer les coefficients du L-estimateur par la
mthode bootstrap, en sappuyant sur les 30 observations de lchantillon de capabilit machine. La
taille des chantillons dfinie dans la gamme de contrle est de n=6.
La fonction de poids obtenue, a une forme en U peu prononce, qui peut tre attribue la faible
reprsentation des observations dans les queues de la distribution empirique, ce qui donne un
caractre platikurtique cette dernire.
Fonction de poids du L-estimateur de position
0
0.1
0.2
0.3
0.4
0.5
0.17 0.33 0.5 0.67 0.83 1
u
J
(
u
)
Bootstrap Moyenne
Le calcul des variances de la moyenne empirique et du L-estimateur de position nous permet alors
dtablir lefficacit relative des deux estimateurs, qui est ici trs proche de 1, comme on pouvait
sy attendre.
Var ( m)= 1,519.10
-5
Var (

X )= 1,565.10
-5
do lefficacit relative : ER(

X , m) =0.97
Pilotage par carte L
Dans ce cas il est vident que les estimations effectues laide de la moyenne et du L-estimateur
de position sont indiscernables les unes des autres. Comme on peut le constater sur la carte de
contrle (Figure 98) les limites de contrle, les tracs de la carte de Shewhart et la carte L se
superposent totalement.
Carte L et Carte Xb
5.23
5.24
5.25
5.26
5.27
5.28
LC(mu)
Mu
Moyenne
LC(Xb)
Figure 98
Les donnes reportes sur la carte de contrle rvlent un procd hors contrle. Celui-ci est
cependant parfaitement pilot, mais avec des limites de contrle largies, qui permettent de garantir
que la production reste dans les tolrances tout en autorisant une certaine drive de la moyenne.
Cette procdure est trs souvent applique lorsque la capabilit machine est suprieure 2, car elle
permet de rduire le nombre dinterventions sur un procd difficilement pilotable.
Conclusion
Ce chapitre nous a permis dtudier en dtail le comportement de la carte L au travers de trois
applications industrielles.
Aprs avoir dfini les conditions opratoires pour une bonne application de la carte L nous avons
trait deux exemples en plasturgie sur des procds de type multi-empreintes et un exemple dans
lindustrie du dcolletage sur un tour multibroches.
Les tudes menes sur des presses injecter ont mis en vidence la forte non normalit des critres
couramment surveills. Dans ces conditions, la carte L savre particulirement intressante car elle
permet de dtecter beaucoup plus rapidement les drives du procd. Par ailleurs, les rglages
effectus sur le procd lors de la dtection dun tat hors contrle du procd (point hors des
limites ou dtection dune tendance) sont beaucoup plus prcis lorsque lon utilise une carte L.
La troisime tude mene sur un tour multibroches a rvl, contre toute attente, que la loi de
distribution des observations pouvait tre assimile une loi normale. Nous avons montr dans ce
cas que lutilisation de la carte L tait sans risque puisque les coefficients du L-estimateur taient
trs proches de ceux de la moyenne et que par consquent lefficacit de la carte L et de la carte de
Shewhart

X /S taient quivalentes. Nous conseillons donc par prudence dutiliser de la carte L


sur des procds qui sont potentiellement non normaux, mme si celle-ci na pas t vrifie. En
effet, dans le pire des cas (celui dune normalit), la carte L sera aussi performante que la carte
de Shewhart.
Chapitre 5
Conclusion et perspectives
Parmi les sujets qui proccupent les industriels et les chercheurs dans le domaine de la M.S.P,
ltude des procds non normaux est particulirement lhonneur. Nos travaux, qui sinscrivent
dans ce cadre, ont eu pour ambition de fournir une approche gnrale pour le pilotage des procds
non normaux.
En guise de conclusion, nous effectuerons, une synthse des rsultats obtenus puis nous ferons le
point sur les orientations donner aux travaux futurs pour enrichir ces premiers rsultats.
Les causes de non normalit
Notre premier objectif a t de recenser les facteurs qui peuvent engendrer la non normalit dune
production. Ltude de procds non normaux est parfois complexe et ne rvle pas toujours les
causes de cette non normalit. Cependant on peut distinguer deux types de non normalit :
- La non normalit provient souvent de linfluence prpondrante de plusieurs facteurs de
dispersion inhrents au procd. Il sagit par exemple des empreintes sur une presse injecter.
- Dans dautres cas, la grandeur physique surveille explique elle seule la non normalit de la
distribution des mesures. Cest le cas des planits ou des circularits en mcanique.
Ltat de lart
La non validit de lhypothse de normalit des observations a des rpercussions la fois sur la
validit et les performances des diffrents outils statistiques utiliss. Ainsi de nombreuses
approches ont t proposes pour le calcul des indicateurs de capabilit et la construction de cartes
de contrle.
La bibliographie concernant le calcul des indicateurs de capabilit est sans aucun doute la plus
riche. Le problme de la validit de ces indicateurs concerne en effet un grand nombre de sous-
traitants de lautomobile qui connaissent soit des procds non normaux soit des procds mal
matriss.
La plupart des mthodes proposes sappuient sur une dfinition de la dispersion qui est troitement
lie au pourcentage de pices hors tolrances. La dispersion est en effet dfinie comme tant
lintervalle centr couvrant 99,73% de la population.
Nous considrons pour notre part, que cette construction des indicateurs ne fournit pas une
information conforme au niveau de qualit rel de la production.
En effet une production dcrite par une loi platikurtique (provenant dun procd non matris) aura
les mmes Cp et Cpk quune production dcrite par une loi normale (provenant dun procd
parfaitement matris) de mme dispersion (99,73%). Cette dernire ayant pourtant un niveau de
qualit bien suprieur.
Les indicateurs de capabilit classiques , qui se basent sur une dfinition de la dispersion de 6o,
donnent en revanche une interprtation du niveau de qualit assez proche de celle que propose
Taguchi en pnalisant tout cart dune mesure par rapport la cible.
Placer les pices lintrieur de lintervalle de tolrance est certes une condition ncessaire
lobtention de la qualit, mais pas une condition suffisante. Il faut aussi centrer la production sur la
cible. Cest pourquoi nous prfrons la dfinition classique des indicateurs Cp et Cpk qui peuvent
tre utilement complts par le Cpm.
Les travaux concernant les cartes de contrle sont peu nombreux. Ils se focalisent essentiellement
sur la prcision des tests par intervalle de confiance dans le but de garantir un risque o de 0,27%.
Cette approche que nous qualifions de puriste ne nous apparat pas dun intrt fondamental. En
pratique, la dispersion et les queues des distributions ne peuvent tre connues parfaitement. On se
satisfait gnralement de tests permettant de prendre des dcisions avec des risques
raisonnables .
La performance des estimateurs ponctuels est par contre peu aborde alors quelle conditionne la
fois la sensibilit de la carte et la prcision des rglages. La moyenne et la mdiane utilises assez
systmatiquement peuvent en effet savrer des estimateurs mdiocres pour certains types de
distributions.
Dfinition du cadre dtude
Les deux objectifs que nous nous sommes fixs pour dfinir le cadre de travail taient donc :
- Rechercher loptimalit de lestimateur ponctuel
- Proposer une approche non paramtrique pour ne pas limiter notre domaine dapplication une
famille particulire de lois.
Nos travaux se sont donc appuys sur les statistiques dordre qui constituent un outil privilgi de
la statistique non paramtrique. Le L-estimateur des moindres carrs propos par Lloyd sest avr
particulirement adapt notre problme. Il a en effet les proprits suivantes :
- Il se base sur un modle non paramtrique de localisation chelle,
- Il fournit une estimation sans biais des paramtres de localisation et dchelle,
- Il fournit une estimation variance minimale parmi les estimateurs construits partir dune
combinaison linaires des observations,
- Les paramtres estimer peuvent tre dfinis par lutilisateur.
Pour satisfaire ces objectifs, nous avons propos une nouvelle carte de contrle (la carte L)
sappuyant sur des L-statistiques, particulirement adaptes aux cas des procds non normaux.
Le choix des paramtres estimer
Le choix du paramtre de localisation peut tre sujet discussion lorsque la population nest pas
symtrique puisque la tendance centrale de la loi na plus de signification. Nous avons donc
propos de dfinir ce paramtre selon le critre de la perte au sens de Taguchi.
Nous avons montr que le paramtre moyenne permettait de minimiser la perte au sens de Taguchi
dans le cas dune fonction perte symtrique. Dans le cas contraire, le calcul ncessite la
connaissance de la loi de distribution des observations. Ce cas de figure ne rentre donc pas dans le
cadre non paramtrique que nous nous sommes fixs.
Construction dune carte L
Le calcul des coefficients du L-estimateur de Lloyd ncessite la connaissance de la matrice de
covariance des statistiques dordre. Nous avons montr exprimentalement quune quarantaine
dchantillons taient ncessaires pour que les coefficients de cette matrice soient dans le voisinage
de leurs valeurs asymptotiques. Cependant la dure dune telle priode de rfrence peut tre
rdhibitoire pour certaines productions.
Nous avons donc propos deux procdures de dmarrage de la carte L permettant de rduire la
priode de rfrence pour piloter au plus tt :
- La premire mthode concerne plus particulirement les procds volution lente. Elle consiste
faire voluer les coefficients du L-estimateur de la moyenne vers les coefficients optimaux au
fur et mesure de lacquisition dinformations sur le procd.
- La seconde mthode savre particulirement intressante lorsque le volume de donnes est
faible. On procde lacquisition dau moins 20 observations sur une priode stable pour
constituer une population empirique. A partir de ces donnes on calcule par une mthode
bootstrap les statistiques ncessaires la construction du L-estimateur des moindres carrs.
Performances de la carte L
Ltude de la carte L a mis en vidence un certain nombre de caractristiques intressantes :
- Le trac des estimations est peu bruit par rapport celui de la moyenne, ce qui permet de
dtecter plus facilement dventuelles tendances du procd.
- La POM de la carte L est toujours infrieure celle de la carte de Shewhart lorsque les limites
de contrle sont places 3o
L-estimateur
de la cible.
- Malgr la faible robustesse du L-estimateur de Lloyd aux valeurs extrmes, la dgradation de ses
performances dans le cas dune modification de la distribution des observations nentrane pas
un comportement dfavorable. Le biais du L-estimateur de position et de dispersion savre en
effet ngligeable et les modifications de la population sont dtectes au mme titre que les autres
causes spciales.
En outre, nous avons propos une extension de la carte L en appliquant une procdure CUSUM aux
estimations du L-estimateur des moindres carrs. Cette carte savre plus sensible que la carte
CUSUM standard et possde encore de bonnes performances quand lefficacit relative de la
moyenne par rapport au L-estimateur est de lordre de 0.8.
Nanmoins cette approche nest pas la seule possible. On peut aussi envisager de construire
dautres cartes comme les cartes EWMA.
Les limites de la carte L
Bien que le modle non paramtrique de localisation chelle dcrive un grand nombre de lois, nous
avons montr que celui-ci ntait pas adapt aux lois de dfaut de forme. En effet, les paramtres de
localisation et dchelle nont plus la mme signification lorsque la distribution de la population
volue.
Application industrielle
Ltude de presses injecter multi-empreintes a mis en vidence la forte non normalit des critres
tudis. Nous avons montr dans ces cas que la carte L tait particulirement intressante
puisquelle dtecte plus rapidement les drives du procd et permet des rglages plus prcis.
A loppos, le suivi dun tour multibroche a rvl contre toute attente que la loi de distribution des
observations pouvait tre assimile une loi normale. Dans ce cas, les coefficients du L-estimateur
tant trs proches de 1/n les performances de la carte L sont quivalentes celles de la carte de
Shewhart.
Lutilisation de la carte L est donc sans risque si la non normalit dun procd na pas t vrifie.
Perspectives
Avant dnumrer les aspects de la recherche quil nous semble important de dvelopper pour
complter ces premiers rsultats, nous rappellerons les principales motivations de nos travaux.
Les conventions CIFRE ont en effet pour vocation de favoriser le transfert technologique et les
changes dides, souvent trop ponctuels, entre le milieu universitaire et le milieu industriel. Ainsi
un travail important reste raliser pour la diffusion auprs des industriels des mthodes prsentes
dans ce mmoire. Ce travail de diffusion doit galement saccompagner dun dveloppement
doutils informatiques permettant lapplication des ces nouveaux concepts.
Le travail du chercheur a la particularit de ntre jamais termin, ce qui rend ce mtier si
passionnant. Certains aspects importants de notre travail restent en effet dvelopper.
Le premier sujet de recherche dcoule des limites constates lors de lapplication des cartes L dans
le cas des dfauts de forme. Il serait en effet intressant de proposer une mthode pour piloter les
procds dont la loi volue en fonction du paramtre de localisation. Cest le cas de nombreux
critres unilatraux.
Un second sujet concerne la vrification de loptimalit du L-estimateur des moindres carrs sur des
procds non stationnaires. On peut par exemple envisager une approche adaptative du calcul des
coefficients du L-estimateur. On peut aussi envisager une vrification rgulire de la validit des
coefficients par rapport la loi de distribution des dernires observations. Les mthodes bootstrap
ainsi que la construction dintervalle de confiance sur les statistiques bootstrapes peuvent selon
nous apporter une rponse intressante ce type de problme.
Enfin, une tude portant sur lapplication des cartes L dans le cas des petites sries permettrait de
connatre les limites de la mthode dans un contexte o le volume dinformations est
particulirement faible.
Ce travail reprsente la deuxime contribution du Laboratoire de Logiciels pour la Productique
(LLP/CESALP) dans laction de recherche pour la Matrise Statistique des Procds, aprs les
travaux de Mr Maurice PILLET sur les petites sries. Il est le fruit dune troite collaboration entre
les socits ODS Europe, FOCAL industrie et le laboratoire LLP/CESALP.
Annexe 1
Les notations mathmatiques
Statistiques dordre
X X X
n 1 2
, , , Variables alatoires indpendantes.
X X X
n ( ) ( ) ( )
, , ,
1 2 Variables alatoires ordonnes.
x x x
n 1 2
, , , Observations indpendantes.
x x x
n ( ) ( ) ( )
, , ,
1 2 Observations ordonnes.
x x x
n n n n ( : ) ( : ) ( : )
, , ,
1 2 Observations ordonnes dun chantillon de taille n.

X
n
Vecteur de n observations de la variable X
P X ( )
Fonction de rpartition de la variable X
Pn X ( )
Fonction de rpartition empirique
p X ( )
Densit de probabilit de la v.a. X
F
r
( x)
Fonction de rpartition de la statistique dordre X(r)
f
r
( x)
Densit de probabilit de la statistique dordre X(r)
F
r : n
( x )
Fonction de rpartition de la statistique dordre X
r:n
f
r : n
( x )
Densit de probabilit de la statistique dordre X
r:n

r n r n
E X
: :
( ) = Esprance dune statistique dordre

r n
k
r n
k
E X
:
( )
:
=
Moment dordre k dune statistique dordre

rs n r n s n
E X X
: : :
=
Statistique classique

X
Esprance de la variable X.
o
X
VAR X
2
= ( ) Variance de la variable X
o
XY
COV X Y = ( , )
Covariance des variables X et Y
ER( m,

X ) Efficacit relative de m par rapport

X .
ERA( m,

X ) Efficacit relative asymptotique de m par rapport

X .
x
p
p-quantile dune loi de probabilit.
Annexe 2
Dveloppements mathmatiques
Les courbes de Johnson
Afin de dterminer les courbes de Johnson, on applique les relations correspondant au type de
courbe choisi. Ces fonctions dpendent des paramtres m, n et p tablis partir des p-quantiles de la
distribution de la population.
Courbes non bornes (mn/p
2
> 1)
Equation
z=g+hsinh
1
(
xe

)
Dtermination des paramtres
- h=2 z

cosh
1
|
1
2
(
m
p
+
n
p
)

1
- g=hsinh
1

(
n
p

m
p
)|
2
(
m
p

n
p
1
)
1/ 2

- =2 p
(
m
p

n
p
1
)
1/ 2
|(
m
p
+
n
p
2
)(
m
p
+
n
p
+2
)
1/ 2

1
- e=
x
z
+x
z
2
+p
(
n
p

m
p
)
|
2
(
m
p
+
n
p
+2
)

1
Courbes bornes (mn/p
2
< 1)
Equation
z=g+hln
(
xe
+ex
)
Dtermination des paramtres
- h=z

cosh
1
(
1
2
|
(
1+
p
m
)(
1+
p
n
)

1/ 2
)
1
- g=hsinh
1

(
p
n

p
m
)
|
(
1+
p
m
)(
1+
p
n
)
4

1/ 2

|
2
(
pp
mn
1
)

- =p
|
(
1+
p
m
)(
1+
p
n
)
2

2
4

1/ 2
(
pp
mn
1
)
1
- e=
x
z
+x
z
2

2
+p
(
p
n

p
m
)
|
2
(
pp
mn
1
)

1
Courbes log-normales (mn/p
2
= 1)
Equation
z=g+hln ( xe)
Dtermination des paramtres
-
h=
2 z
ln ( m/ p)
-
g=hln
(
m/ p1
p ( m/ p)
1/ 2
)
- e=
x
z
+x
z
2

p
2
(
m/ p+1
m/ p1
)
Construction du L-estimateur des moindres carrs
de Lloyd
Introduction
Nous allons dans cette annexe justifier la construction de l'estimateur des moindres carrs.
Rappelons tout dabord quelques rsultats concernant la mthode des moindres carrs gnraliss.
Les moindres carrs gnraliss
Considrons le modle linaire multiple suivant Y Xb u = +
o :
Y =
(
y
1
M
y
n
)
est appele variable dintrt.
u=
(
u
1
M
u
n
)
est un vecteur alatoire modlisant les variations de Y .
b=
(
b
1
M
b
n
)
est le vecteur des paramtres que lon cherche estimer par les moindres carrs.
X =
|
x
11
L x
1n
M O M
x
m1
L x
mn

est une matrice contenant des variables dites exognes non alatoires.
On suppose les conditions suivantes satisfaites: Eu et V u I
n
( ) ( ) = = 0
2
o
Estimer les paramtres b par les moindres carrs consiste minimiser linfluence de la variable
alatoire u. On cherche la statistique ( ) b b b
n
=
1
qui minimise
S b S b b u
n i
i
n
( ) ( ) = =
=
1
2
1
.
Ce qui revient calculer : Min

i=1
n
(
Y
i

j=1
m
b
j
X
ji
)
2
S(b) scrit sous forme vectorielle :
S b Y bX Y bX
Y Y b X Y b X Xb
t
t t t t t
( ) ( ) ( ) =
= + 2
On drive S(b) par rapport chacun des paramtres du vecteur b. On obtient alors le systme des
quations normales :
+ = 2 2 0 X Y X Xb
t t
Do lestimateur des moindres carrs ordinaires :

b=( X
t
X )
1
X
t
Y
Application un chantillon ordonn
Reprenons maintenant le problme pos par Lloyd. On crit l'expression de l'esprance des
statistiques d'ordre X(r) sous forme vectorielle
E| X ( r )=m
p
. e+s
p


o a est le vecteur des
r
et e est un vecteur avec des composantes unitaires.
On note
X =
(
x( 1 )
M
x( n)
)
e=
(
1
M
1
)
=
(

1
M

n
)
On peut rcrire lquation prcdente sous la forme E X A = u
o
q=
(
m
s
)
et A=
|
1
1
M M
1
n

La matrice de covariance de X est donne par : COV ( X )=s


2
D
O est une matrice (nxn) des lments
e
rs
On a alors le modle linaire suivant :

X =Aq+u
E( u)=

0
V ( u)=V ( X )=s
2
D
o u reprsente la composante alatoire de X.
Ce modle est dit gnral car V u ( ) = o
2
O
O tant une matrice dfinie positive, il existe une matrice M(n,n) rgulire telle que :
M M
t
=

O
1
On peut alors multiplier par M la relation :
X A u MX MA Mu = + = + .u u
En oprant le changement de variable : Z=MX T=MA et v=Mu
on a :

E( v )=0
V ( v )=MV ( u) M
t
=s
2
I
n
Z=Tb+v est donc un modle linaire multiple ordinaire et on connat lestimateur des moindres
carrs ordinaires de u.
q=( T
t
T )
1
T
t
Z
i( A
t
M
t
MA)
1
A
t
M
t
MX
i( A
t
D
1
A)
1
A
t
D
1
X
Une estimation du vecteur u au sens des moindres carrs gnraliss est donne par :
q=( A
t
D
1
A)
1
A
t
D
1
X
La variance des estimateurs est donne par :
Var | m =s
p
2

t
D
det ( A
t
D
1
A)
Var | s=s
p
2

e
t
De
det ( A
t
D
1
A)
Construction du L-estimateur de Bovik
Introduction
Ainsi, la sortie Y
k
d'un L-filtre est donne par une combinaison linaire des statistiques d'ordre x(j)
avec des coefficients rels nots C
j
(o j=1..n).
Y C x( j)
k j
j 1
n
=
=
(1)
Si on gnralise cette notion en dfinissant une fonction |, on obtient un NL-filtre ; la fonction |
ayant ventuellement un caractre non linaire.
F : -
Telleque:Y
k
=F ( x( 1 )ii x( 2 ))
Optimisation des coefficients
Dans notre tude, nous ne nous intressons qu'aux L-estimateurs ou L-filtres dont l'intrt
est de pouvoir dterminer de manire relativement simple un jeu de coefficients optimaux au sens
de l'erreur quadratique moyenne d'estimation, en tenant compte de la forme de la distribution du
bruit. L'application de ces L-estimateurs reste nanmoins rduite aux distributions symtriques.
Si le procd est stationnaire, nous pouvons modliser les mesures par X
k
=s
k
+B
k
, o s
k
est une
constante (position du procd lie aux causes spciales ) et B
k
est un bruit blanc centr ayant une
densit de probabilit symtrique (dispersion due aux causes communes).
Pour un ensemble de mesures conscutives, les statistiques d'ordre vrifient:
x(j)=s
k
+B(j)
o B(j) est la j
me
statistique d'ordre du bruit.
On en dduit que l'estimation peut s'crire :
Y s C C B j
k k j j
= +

( )
La symtrie de la distribution du bruit nous amne traiter un cas assez particulier car d'une part
l'esprance des ralisation de la variable alatoire associe au bruit est nulle, E B = 0., et d'autre
part les coefficients de pondration du L-estimateur sont symtriques du fait de la structure des L-
filtres.
C C j
1 j n j +
= eZ
on a alors
E Y s C C E B j s C
k k j
j
j
j
k j
j
= + =

( )

Une condition suffisante pour obtenir un biais nul est E Y s
k k
= , ce qui implique que la somme
des coefficients C doit tre gale 1. Si on utilise un vocabulaire propre au traitement du signal, on
dit que le L-filtre a un gain statique unitaire.
On peut valuer les performances de l'estimateur sans biais en calculant sa variance.
Var
|
Y
k

=E
| (
Y
k
E( Y
k
)
)
2

=E
| (
Y
k
s
k
)
2

i E
|
(

j
C
j
B( j )
)(

p
C
p
B( p)
)

j

p
C
j
E| B( j )B( p)C
p
Cette dernire peut s'crire sous forme vectorielle:
Var Y C R C
k
t
= (2)
o
t
C=
(
C
1
LC
n
)
est le vecteur des coefficients pondrateurs du L-estimateur et R est la matrice
de corrlation de bruit ordonn telle que
R E B j B p
jp
= ( ) ( )
L'expression de la variance d'un L-estimateur met en vidence que son efficacit est
conditionne par le bon choix des coefficients C. Pour calculer les coefficients optimaux nous
allons nous appuyer sur deux critres que l'on essayera d'optimiser.
D'une part nous souhaitons avoir la somme des coefficients C la plus proche possible de 1 :
C
j
j

= 1
Et d'autre part nous voulons minimiser la variance de l'estimateur Var Y C R C
k
t
= .
Introduisons tout d'abord le vecteur unit e tel que
t
e=( 1 L1)
Pour optimiser les deux critres que l'on s'est fix, nous allons minimiser la fonctionnelle suivante :
j ( C , )=
t
CRC+( 1
t
Ce)
Afin de dterminer pour quelles valeurs des coefficients la fonctionnelle trouve son minimum, nous
allons calculer les drives partielles de 1 par rapport aux coefficients c
1
...c
n
.

j
c
1
=

j=1
n
R
j1
c
j
+

p=1
n
R
1p
c
p
=2

k=1
n
R
1k
c
k

M
j
c
n
=

j=1
n
R
jn
c
j
+

p=1
n
R
np
c
p
=2

k=1
n
R
nk
c
k

Le vecteur des drives partielles peut donc s'crit


|
j
c
1
M
j
c
n

=2 . RCe
La fonctionnelle 1 admet un minimum absolu lorsque les drives partielles s'annulent. Pour
connatre les coefficients C nous cherchons donc rsoudre le systme d'quation :

2 RCe=

0
t
eC=1
Les solutions sont : =

=

2
1
1
1 t t
e R e
et C
R e
e R e
Les coefficients optimaux des L-estimateurs sont donc calculs l'aide de la relation :
C
R e
e R e
t
=

1
1
Etude de capabilit dans le cas dune loi de dfaut
de forme
Loi normale sous-jacente de moyenne nulle
Dans le cas dune loi de dfaut de forme f
d
, nous savons que le rapport entre la moyenne et lcart
type de f
d
ne peut pas tre infrieur une valeur qui correspond au cas o la moyenne de la loi
normale sous-jacente est centre sur zro.
Nous allons donc calculer ce rapport pour une loi normale sous-jacente de moyenne nulle.
Soit lexpression de la loi de dfaut de forme :
f
d
( x)=2
e
(

x
2
2
)
.2 p
x0} {}
i
La moyenne de la loi de dfaut de forme est alors
m=

xf
d
( x)dx=
.
2
p
=0 . 7979
Nous calculons galement lcart type de la loi de dfaut de forme :
E ( x
2
)=

x
2
f
d
( x)dx=1
s=
.
E ( X
2
)E ( X )
2
=
.
1
2
p
=0 . 60281
Do la valeur limite du rapport /o.
m
s
=
.
2
p2
=1 . 323608
La Norme AFNOR NF E 60-181 propose de dfinir la dispersion telle que D=5o.
Nous pouvons vrifier dans ce cas que la dispersion couvre 99.74% de la population.

0
5s
f
d
( x)dx=0 . 997422
Calcul de la dispersion de la loi de dfaut de forme en fonction
de sa moyenne et son cart-type
Le calcul de la dispersion de la loi de dfaut de forme ntant pas ais, les normes fournissent
gnralement cette information sous forme de tableau en fonction dun paramtre facilement
estimable.
La Norme AFNOR E 60-181 fournit ces donne en fonction du rapport /o.
/o
Dispersion 99.73%
/o
Dispersion 99.73%
/o
Dispersion 99.73%
1.3236 5.0 1.9 4.8 2.5 5.3
1.4 4.8 2.0 4.9 2.6 5.4
1.5 4.7 2.1 5.0 2.7 5.5
1.6 4.7 2.2 5.1 2.8 5.6
1.7 4.7 2.3 5.1 2.9 5.7
1.8 4.8 2.4 5.2 3.0 5.8
Annexe 3
Dmonstrations
Optimalit des estimateurs
Calcul des bornes de Frechet dans le cas dune loi normale.
Dmonstration
On suppose une variable alatoire X qui suit une loi normale N(,o).
f ( x)=
e

( xm)
2
2 s
2
s .2 p
Nous cherchons calculer la bornes de Frechet pour une statistique T
n
qui est une estimateur du
paramtre .
On calcule linformation de Fisher
I ( m)=E
|

m
Log ( f ( x , m) )

2
I ( m)=
1
s
3
.2 p

( xm)
2
2 s
2
dx =
1
s
2
On peut alors calculer la borne de Frechet pour une statistique T
n
utilisant un chantillon de taille n.
B
F
=
1
I
n
( m)
=
1
n. I ( m)
=
s
2
n
La moyenne empirique est donc une estimateur efficace de puisque V (

X )=
s
2
n
=B
F
Programme Maple
restart :
with(linalg) :
f :=(x)->exp(-(((x-mu)/sigma)^2)/2)/(sigma*sqrt(2*Pi)) ;
information de Fisher
g :=unapply(simplify(diff(log(f(x,mu)),mu$2)),(x,mu)) ;
i :=int(-g(x,mu)*f(x),x=-infinity..infinity) ;
Borne de Frechet
frechet :=evalf(1/(n*i)) ;
Calcul des bornes de Frechet dans le cas dun mlange de lois
Nous avons compar les performances du L-estimateur des moindres carrs aux bornes de Frechet
pour deux mthodes dchantillonnage (lchantillonnage alatoire et lchantillonnage squentiel).
Le procd
Le procd que nous avons simul se constitue dune population stratifie compose de 6 lois
normales (voir chapitre 3 3.4.3).
N(0,1) N(5.5,1) N(5,1) N(5,1) N(-3.2,1) N(-3.5,1)
Efficacit du L-estimateur
Borne de Frechet
V() - Ech Alatoire V() - Ech Squentiel
3 0.01277 4.2853 0.4863
4 0.00957 2.4537 0.4507
5 0.00766 1.5157 0.334
6 0.006386 1.011 0.1666
7 0.005474 0.7238 0.2047
8 0.004790 0.5499 0.1951
9 0.004258 0.44 0.1431
10 0.003832 0.3648 0.1582
On constate, travers ces rsultats, que malgr son optimalit par rapport aux estimateurs linaires
(construits a partir dune combinaison linaire des observations), le L-estimateur des moindres
carrs nest pas un estimateur efficace (Var( m ) >> B
F
).
L-estimateur des moindres carrs
Calcul des coefficients dans le cas dune loi normale
Le calcul des coefficients du L-estimateur de Lloyd est particulirement lourd car il ncessite
dtablir les moments dordre et la matrice de covariance des statistiques. La plupart du temps on a
recours au calcul numrique pour raliser de tels calculs.
Nous avons nanmoins ralis un programme permettant de calculer les coefficient du L-estimateur
de Lloyd dans le cas de distributions simple. La complexit des calculs vient souvent a bout de la
puissance de calcul de Maple, mme sur une station type RS 6000.
Calcul de la matrice de covariance et des moments des Statistiques dordre
Programme ralis par Mohammed Tabiza (doctorant au LAMII)
restart;
with(linalg):
n:=3;med:=2;
sigma:=1;
fp := u->1/sqrt(2*Pi)/sigma*exp(-u^2/(2*sigma^2));
fn := unapply(fp(u),u);
Fp := x-> 1/2 + int(fp(u),u=0..x):
Fn := x-> int(fn(u),u=-infinity..x):
Gp := (x,r)-> x* Fp(x)^(r-1)*(1-Fp(x))^(n-r) * fp(x):
Gn := (x,r)->x*Fn(x)^(r-1)*(1-Fn(x))^(n-r) * fn(x):
K :=(r) ->factorial(n) /(factorial(r-1)* factorial(n-r)):
KK :=(r,s) ->factorial(n) / (factorial(s-r-1)*factorial(n-s)*factorial(r-1)):
Hp := (v,w,r,s)->v*w*Fp(v)^(r-1)*(Fp(w)-Fp(v))^(s-r-1) *(1-Fp(w))^(n-s) * fp(v) *fp(w):
Hn := (v,w,r,s)->v*w*Fn(v)^(r-1)*(Fn(w)-Fn(v))^(s-r-1) *(1-Fn(w))^(n-s) * fn(v)* fn(w):
Hnp := (v,w,r,s)->v*w*Fn(v)^(r-1)*(Fp(w)-Fn(v))^(s-r-1) *(1-Fp(w))^(n-s) * fn(v) *fp(w):
Hnn := (x,r)-> x* Gn(x,r):
Hpp := (x,r)-> x * Gp(x,r):
esper:=(r)->K(r) *( int(Gn(x,r),x=-infinity..0) + int(Gp(x,r),x=0..infinity)):
mu:=array(1..n):
mu[med]:=0.0:
for t to n/2 do
mu[t]:=evalf(esper(t));
mu[n-t+1]:=-mu[t]
od:
#covariance pour j<k
cov := (r,s)->KK(r,s)*(int( int(Hn(v,w,r,s),v=-infinity..w),w=-infinity..0)
+int( int(Hnp(v,w,r,s),v=-infinity..0),w=0..infinity)+ int(int(Hp(v,w,r,s),v=0..w),
w=0..infinity));
mat:=array(1..n,1..n):
for ii from 1 to med-1 do
for jj from ii+1 to n-ii+1 do
mat[ii,jj] := evalf(cov(ii,jj));
mat[n-jj+1,n-ii+1] := mat[ii,jj];
mat[n-ii+1,n-jj+1] := mat[ii,jj];
mat[jj,ii] := mat[ii,jj];
od;
od:
print(mat);
var:=(r)->K(r) *(int(x*Gn(x,r),x=-infinity..0)+int(x*Gp(x,r),x=0..infinity)):
mat[med,med] := evalf(var(med));
for i from 1 to med-1 do
mat[i,i] :=evalf( var(i));
mat[n-i+1,n-i+1] := mat[i,i]:
mat[i,n-i+1] := mat[i,i]:
mat[n-i+1,i] := mat[i,i]:
od:
print(mat);
print(mu);
Dans le cas dune loi normale, on trouve les coefficients suivants :
Vecteur des moments des statistiques dordre
=|0 . 84628 0 0 . 84628
Matrice de variance covariance des statistiques dordre
D=
|
0 . 5595 0 . 2757 0 . 1649
0 . 2757 0 . 4486 0 . 2757
0 . 1649 0 . 2757 0 . 5595

Calcul des coefficients du L-estimateur de Lloyd


restart:
with(linalg):
Taille de l'chantillon
Nbechant:=3;
Moyenne et Ecart type de la population
moypop:=0;Ecpop:=1;
Vecteur des moyennes des statistiques d'ordre (de x(1) x(n))
alpha:=matrix([[-0.8462843753],[0],[0.8462843753]]);
Matrice de covariance de bruit ordonn : COV (Yr,Ys)
vect:=matrix([[0.5595, 0.2757, 0.1649, 0.4487,0.2757, 0.5595]]):
omega:=matrix(Nbechant,Nbechant):
z:=0:
for i from 1 to Nbechant do
for j from i to Nbechant do z:=z+1:omega[i,j]:= vect[1,z]:omega[j,i]:=vect[1,z]:od:
od;
print (omega);
e:=convert(array(identity,1..Nbechant),matrix):
Matrice de covariance inverse
omega2:=inverse(omega);A:=concat(e,alpha);Atrans:=transpose (A):
Coefficients du L-estimateur de LLOYD
1ere ligne Coefs de l'estimateur de position (mu)
2me ligne Coefs de l'estimateur de dispersion (sigma)
Coefs:=evalm(inverse(Atrans &* omega2 &* A) &* Atrans &* omega2 );
Etude des variances
delta:=det (Atrans &* omega2 &* A):
Variance du L-estimateur pour le paramtre de localisation
vmu:=evalm((transpose(alpha) &* omega2 &* alpha )*(Ecpop^2/delta));
vmoy:=(Ecpop^2)/Nbechant;
Variance du L-estimateur pour le paramtre dchelle
vsigma:=evalm((transpose (e) &* omega2 &* e)*(Ecpop^2/delta));
Dans le cas de la loi normal, les coefficients sont ceux de la moyenne puisque lon trouve :
Coefs=
|
0 . 333332 0 . 333332 0 . 333332
0 . 590818 0 0 . 590818

La variance du L-estimateur de position est la mme que celle de la moyenne :


Vmu=0 . 33333=
s
2
3
La variance du L-estimateur de dispersion est :
Vsigma=0 . 27548
Rfrences Bibliographiques
Ouvrages
AF0 95 AFNOR Norme NF X 06-031-0
Application de la Statistique - Cartes de contrle - Principes Gnraux - 1995
AF1 95 AFNOR Norme NF X 06-031-1
Application de la Statistique - Cartes de contrle de Shewhart aux mesures -1995
ISSN 0335-3931
AF4 95 AFNOR Norme NF X 06-031-4
Application de la Statistique - Cartes de contrle des Sommes Cumules - 1995
AFN 94 AFNOR Norme NF E 60-181
Moyens de production - Conditions de rception - Mthode dvaluation de
laptitude raliser des pices - 1994
Ard 95 ARDILLY
Les techniques de sondage - Technip - 1995
Bou 78 BOUROCHE J.M. & SAPORTA G.
Lanalyse des donnes - P.U.F.- Que sais-je ? - 1980
Cap 88 CAPERAA Ph & VAN CUTSEM B
Mthodes et modles en statistiques non paramtriques Expos fondamental
Presse de l'universit Laval - DUNOD - 1988
Dav 81 DAVID H. A.
Order Statistics - New York - Willey - 1981
Gen 74 GENET J., PUPION G., REPUSSARD M.
Probabilits, Statistiques et sondages - Vuibert - 1974
Gra 83 GRAIS B.
Mthodes Statistiques - Tome 2 - Modules Economiques DUNOD 1983
Hot 47 HOTELLING H.
Multivariable Quality Control - Techniques of statistical analysis
Mc Graw-Hill - New York - 1947
Joh 93 JOHNSON N. L. & KOTZ S
Process Capability Indices - 1993
Kau 94 KAUFMANN P
Information Estimation Tests - Economie-Module DUNOD - 1994
Lec 87 LECOUTRE J.P. & TASSI P.
Statistique non Paramtrique et Robustesse - Economica - 1987
Mon 91 MONGOMERY D. C.
Introduction to Statistical Quality Control
John Wiley & Sons 2nd edition 1991
Pil 97d PILLET M.
Les plans dexprience par la mthode TAGUCHI
Les Editions dorganisation - 1997
Pil 97e PILLET M.
Appliquer la Matrise Statistique des Procds (MSP/SPC)
Les Editions dorganisation - 1997
Rya 89 RYAN P.
Statistical Mthods for quality improvement
John Wiley & Sons 2nd edition - 1989
Sap 78 SAPORTA G.
Thorie et Mthodes de la Statistique - Technip - 1978
She 32 SHEWHART W. A.
Economic Control of Quality of Manufactured Products
Van Nostrand Co. Inc Princeton - 1932
Sil 52 SILVERMAN B.W.
Density Estimation for Statistics and Data Analysis
Chapman an Hall -1952
Sou 86 SOUVAY P.
La statistique outil de la qualit Edition AFNOR - 1986
Tas 89 TASSI Ph
Mthodes Statistiques - Economica 2nde Edition - 1989
Tag 89 TAGUCHI G. ELSAYED A. HSIANG T. C.
Quality engineering in production systems - Mc Graw-Hill - 1989
Whe 91 WHEELER D. J.
Short Run S.P.C. - SPC Press - 1991
Whe 92 WHEELER D. J.
Understanding Statistical Process Control - SPC press - 1992
Wil 62 WILKS S.S.
Mathematical statistics - Wiley 1962
Articles
All 91 ALLOWAY J. A. RAGHAVACHI M.
Control charts based on the Hodges-Lehmann Estimator
Journal of Quality Technology - N23 - pp336-347 - 1991
Bai 95 BAI D.S. and CHOI I.S.
Xb and R control charts for skewed populations
Journal of Quality Technology Vol 27 N2 Avril 95
Bol BOLON Ph.
Filtrage d'ordre, vraisemblance et optimalit des traitements d'image
Traitement du signal Vol 9 N3 - 1993
Bho 91 BHOTE K. R.
World Class Quality - Amacom -1991 -225p
Bov 83 BOVIK A. C.
A generalization of Median Filtering using Linear Combinations of Order
Statistics - IEEE Transaction on acoustics, speech, and signal processing Vol
ASSP 31 - No 6 - 1983
Bov 85 BOVIK A. C. & RESTREPO A.
Adaptive L-filters - Proceeding of the 23 th annual conference on communication
control and computers - Monticello - 1985
Boy 91 BOYLES R. A.
The Taguchi Capability Index
Journal of Quality Technology - Vol 30 N1 - pp17-26 - 1991
Bur 42 BURR, I. W.
Cumulative frequency functions - Annals of Mathematical Statistics,
N13, pp215-232 - 1942
Bur 67 BURR, I. W.
The effect of Non-Normality on constants for

X and R charts
Industrial Quality Control, Vol. 23, N11, pp563-568 Mai 1967
Cas 96 CASTAGLIOLA Ph
Evaluation of non normal Process capability indices using Burr's distributions
Quality engineering 8(4):587-593 - 1996
Cle 89 CLEMENTS J.A.
Process capability calculations for non normal distributions
Quality Progress - N22 pp95-100 - 1989
Dow 54 DOWNTON F.
Least Squares estimates
Annals of Mathematical Statistics Vol 25 pp303-316 1954
Duc 96 DUCLOS E. PILLET M. COURTOIS A.
Optimisation de la Matrise Statistique des Procds par une mthode de filtrage
dordre - Revue de Statistique Applique XLIV (2) pp61-79 - 1996
Duc 97a DUCLOS E. PILLET M. COURTOIS A.
An Optimal Control Chart for non-Normal Processes
IFAC Manufacturing Systems : Modeling, Management and Control -Fevrier
97 - Viennes -Autriche
Duc 97b DUCLOS E. PILLET M. COURTOIS A.
Une mthode destimation optimale applique la M.S.P.
Congrs Qualit et Sret de Fonctionnement - Mars 97 - Angers - France
Efr 79 EFRON B.
Bootstrap Methods :Another look at the Jackknife
Annals of Statistics - N7 - pp1-26 - 1979
Efr 83 EFRON B. CONG G.
A Leisurely look at the bootstrap, the Jackknife, and Cross-Validation
The American Statistician - N37 - pp36-48 - 1983
Efr 86 EFRON B. TIBSCHIRANI R.
Bootstrap Methods for Standard Errors, Confidence Intervals, and Other
Measures of Statistical Accuracy - Statistical Science - N1 - pp57-77 - 1986
Fan 96 FANG. J. & CASE K.E.
Using a correlation test for normality
Journal of Quality Technology Vol 28 N3 -1996
Far 97 FARNUM R.N.
Using Johnson curves to describe non-normal process data
Quality engineering 9(2) - pp329-336 - 1997
Fra 91 FRANKLIN L.A.& WASSERMAN G.S.
Bootstrap Confidence Interval estimates of Cpk : An introduction
Communications in Statistics - Simulation and Computation
N20 - pp231-242 - 1991
Fra 92 FRANKLIN L.A.& WASSERMAN G.S.
Bootstrap Lower confidence limits for capability Indices
Journal of Quality Technology Vol 24 N 4 - 1992
Gru 89 GRUSKA G. F. MIRKHANI K. & LAMBERSON L.R.
Non normal Data Analysis
Applied Computer Solutions Inc - 1989
Gui 96 GUIDEZ L.
Indicateurs de capabilit et populations non gaussiennes
Congrs Qualit SIA - 1996
Gui 97 GUIDEZ L.
MSP : Impact de la non normalit sur les indicateurs de capabilit
2
me
congrs Pluridisciplinaire Qualit et Sret de Fonctionnement - 1997
Gun 89 GUNTER
The use and abuse of Cpk
Quality Progress 22(3), pp108-109 & 22(5), pp 79-80 - 1989
Gup 92 GUPTA A.K.
Estimation of the mean and standard deviation of a normal population from
cesored sample
BIOMETRIKA - Vol 39 - pp 260-273 - 1992
Hac 92 HACKL P. LEDOLTER J.
A control chart based on ranks
Journal of quality technology Vol 23 N2 - 1992
Ham 68 HAMPEL F. R.
Contributions to the theory of robust estimation
PhD Thesis, Universit de Californie - 1968
Ham 74 HAMPEL F. R.
The Influence curve and its in robust estimation J. Amer. Statist. Assoc. - N69
pp 383-393 - 1974
Har 95 HART M.K. HART R.F
Tests for stratification within control chart subgroups
Quality Engineering 7(3) pp 481-491 - 1995
Hil 69 HILLER F. S.
Xb and R-chart Control Limits based on a small number of subgroups -
Journal of Quality Technology - pp17-26 - 1969
Hsi 85 HSIANG T. C. TAGUCHI G.
A tutorial on Quality Control abd assurance - The Taguchi Methods
ASA - Annual Meeting Las Vegas - 1985
Hub 64 HUBER P.
Robuste estimation of a location parameter
Ann. Math. Statist. N35 - pp 73-101 - 1964
Jau 97 JAUPI L. SAPORTA G.
Cartes de contrle pour la variabilit des procds multidimensionnels
Congrs Qualit et Sret de fonctionnement - Mars 97 - Angers
Joh 93 JOHNSON N. L. KOTZ S.
Process Capability Indices - Chapman & Hall - 1993
Koo 91 KOONS G. F.
SPC : Use in low volume manufacturing environment - Statistical Process
Control in Manufacturing - Quality and reliability - ASQC Quality Press - 1991
Kus 92 KUSHLER R.H. & HURLEY P.
Confidence bounds for capability indices
Journal of Quality Technology Vol 24 N 4 - 1992
Llo 52 LLOYD E. H.
Least-Squares Estimation of Location and Scale parameters Using Order
Statistics - Biometrika - Vol 39 - pp 88-95 - 1952
Mor 95 MORTEL R.R. & RUNGE G.C.
Startistical Process Control of Multiple Stream Process
Journal of Quality Technology Vol 27 N 1 - 1995
Owe 69 OWEN DB.
Summary of recent works on variables acceptance sampling with emphasis on
non normality - Technometrics Vol 11 N4 pp631-637 - 1969
Pap 96 PAPPANASTOS E.A. & ADAMS B.M.
Alternative Designs of Hodges-Lehmann Control Chart
Journal of Quality Technology Vol 28 N2 - 1996
Pit 48 PITMAN E. J.
Notes on non parametric statistical inference
Manuscrit non publi
Pea 92 REARN W.L. & KOTZ S.& JOHNSON N.L.
Distribution and inferential properties of process capability indices
Journal of Quality Technology Vol 24 N 4 - 1992
Pea 95 REARN W.L. & KOTZ S.
Application of clements method for calculating second and third generation
capability indices for non normal pearsonian population
Quality Engineering 7(1) pp 139-145 - 1995
Pag 54 PAGE E. S.
Continuous Inspection Schemes - Biometrics - Vol 41 - 1954
Pil 92 PILLET M.
Application du SPC aux Petites Sries
Revue contrle industriel et qualit - N174 - pp58-61 - 1992
Pil 93 PILLET M.
Contribution la Matrise Statistique des Procds - Cas particulier des petites
sries - Thse en Sciences de Lingnieur - Univ. Savoie -1993
Pil 96a PILLET M.
A specific SPC chart for Small-Batch control
Quality Engineering - 8(4) - pp 581-586 - 1996
Pil 96b PILLET M. DUCLOS E. COURTOIS A.
Gnralisation de lindicateur de capabilit Cpm - Cas des tolrances unilatrales
Contrle Industriel et Qualit - N196 - Fvrier 96
Pil 97a PILLET M. DUCLOS E.
SPC - Optimisation de la taille des chantillons dans le cas des systmes
multignrateurs. - Revue Pratique de Contrle Industriel - N 203 - Fevrier 97
Pil 97b PILLET M. ROCHON S. DUCLOS E.
Generalization of capability index Cpm. Case of unilateral tolerances
Quality engineering, N10 Vol 1 - pp 171-176 - 1997/98
Pil 97c PILLET M. ROCHON S. DUCLOS E.
De nombreux indicateurs de capabilit bass sur le bon fonctionnement des
produits - Congrs Qualit et Sret de fonctionnement - Mars 97 - Angers
Pyz 92 PYZDEK T.
Process Capability Analysis Using Personal Computers
Quality. Engineering 4(3), pp419-440 - 1992
Ren RENAULT
Moyens de Production Agrement Capabilite des moyens "Multipostes ..."
Normalisation Equipement E41.32.220.R
Rod 92 RODRIGUEZ R.N.
Recent developments in process capability analysis
Journal of Quality Technology Vol 24 N 4 - 1992
Sch 96 SCHNEIDER H. KASPERSKI W.J. & al
Control charts for skewed and censored data
Quality engineering 8(2):263-274 - 1996
Shi 76 SHILLING E.G. & NELSON P.R.
The effect of non normality on the control limits of Xb charts
Journal of Quality technology - Vol 8 N4 pp183-188 - 1976
Sho 72 SHORACK G.R.
Functions of order statistics - Ann. Math. Statist - N 43 pp 412-427 - 1972
Sli 80 SLIFKER J. F. SHAPIRO S. S.
The Johnson System : Selection and parameter estimation
Technometrics - Vol 22 N2 - pp239-246 - 1980
Som 97 SOMERVILLE S.E.
Process capability indices and non-normal distributions
Quality engineering 9(2) 305-316 - 1997
Tag 85 TAGARE H. D. & FIGUEIREDO R. J. P.
Order Filters - Proceedigs of the IEEE - Vol 73 - No 1 - 1985
Van 64 VAN ZWET W. R.
Convex Transformations of Random Variables. Mathematisch Centrum
Wil 96 WILLEMAIN Th. R. & RUNGER G. C.
Designing Control Charts usung an empirical Reference Distribution
Journal of Quality Technology Vol 28 N1 - 1996
Woo 95 WOODALL W.H. & THOMAS E.V.
Statistical Process Control with several componenrs of common cause variability
IIE Transactions 27 pp757-764 - 1995
You 92 YOURSTONE Steven A. & ZIMMER W.J.
Non normality and the design of control; charts for averages
Decision Science Vol 23 N5 pp 1099-1113 - 1992

Vous aimerez peut-être aussi