Vous êtes sur la page 1sur 12

Chapitre 3 Les outils statistiques de base

Introduction
Dans ce chapitre on va aborder la notion de variabilité des processus de production et des outils
statistiques simples permettant de la mesurer à partir d'un échantillon de produits. Nous allons voir
comment utiliser les résultats d'un échantillon pour prédire les propriétés de l'ensemble de la
production. On remarque souvent que la distribution des valeurs d'un échantillon est proche de
modèles mathématiques qui sont proposés par la théorie des probabilités.

I- Rappel sur les concepts de base


 Population
Une population en statistique est l’ensemble des observations possibles d’une caractéristique d’intérêt.
 Échantillon
Un échantillon d’une population est un sous ensemble de la population qui sera recueilli dans le cadre de
l’étude concernée.
 Individu
C’est un élément de l’échantillon (pièce en cours de mesure)
Un échantillon d’une population est un sous ensemble de la population qui sera recueilli dans le cadre de
l’étude concernée.
 Individu
C’est un élément de l’échantillon (pièce en cours de mesure)

 Variable

Qualité/CFM2 Page 1
La variable est la caractéristique observée. En général les variables étudiées sont quantitatives, c'est-à-dire
mesurables. On distingue deux variables quantitatives :
- Variables discrètes : Une variable est dite discrète si elle prend un nombre fini de valeurs ou un
nombre infini de valeurs mais isolées.
- Variables continues : Une variable est dite continue si elle prend ses valeurs dans un intervalle réel.

Exemple 1
Variable : Résistance ; Type : continue ; Population : Toutes les mesures des résistances produites.
Échantillon : Mesures de 50 résistances.
Exemple 2
Variable : Nombre de paquets qui arrivent à un serveur dans une période d’une minute
Type : discréte ; Population : Tout nombre possible de paquets qui arrivent dans une période d’une minute
Échantillon : Nombre de paquets qui arrivent dans une minute pendant 50 périodes d’une minute.
 Échantillon aléatoire

Un échantillon aléatoire est un échantillon où toutes les unités de la population ont la même chance d’être
sélectionnées. Si par exemple, un ingénieur sélectionne les 10 premières unités produites, son échantillon
n’est pas aléatoire. Pour sélectionner un échantillon aléatoire, il faut utiliser un générateur de nombres
aléatoires.
 Statistique

Une statistique est une mesure faite sur un échantillon.


 Paramètre

Un paramètre est une caractéristique de la population que la statistique va nous permettre d’estimer.

II- Histogramme
1) Definition
L’histogramme est un moyen rapide pour étudier la répartition d’une variable. Il peut être, en particulier
utilisé en gestion de la qualité lorsque les données sont obtenues lors d’une fabrication.
Exemples :
• diamètre d’un arbre après usinage,
• dureté d’une série de pièces après un traitement thermique,
• concentration d’un élément dans la composition d’alliages produit
par une fonderie,

Qualité/CFM2 Page 2
• masse de préparation alimentaire dans une boîte de conserve,
• répartition de la luminosité des pixels dans une photographie.
L’histogramme est un outil « visuel » qui permet de détecter certaines anomalies ou de faire un diagnostic
avant d’engager une démarche d’amélioration. Utilisé dans ce cadre, l’histogramme est un outil « qualitatif
». Pour pouvoir bien mener l’étude de la dispersion d’une variable à l’aide d’un ou de plusieurs
histogrammes, il faut avoir une bonne connaissance de la variable étudiée. De même, il faut connaître les
conditions de collecte des données : fréquence de mesure, outil de mesure utilisé, possibilité de mélange de
lots, possibilité de tri etc.

2) Construction
a) Collecte des données
La première phase est la collecte des données en cours de fabrication. Cette collecte peut être réalisée soit
de façon exceptionnelle à l’occasion de l’étude de la variable soit en utilisant un relevé automatique ou
manuel fait lors d’un contrôle réalisé dans le cadre de la surveillance du procédé de fabrication.
Sans qu’il soit réellement possible de donner un nombre minimum, il faut que le nombre de valeurs
relevées soit suffisant. Plus on dispose d’un nombre élevé de valeurs, plus l’interprétation sera aisée.
b) Nombre de classes
La première opération est de déterminer le nombre de classes de l’histogramme. Généralement, dans le
cadre d’une analyse de ce type, on utilise des classes de largeur identique.
Le nombre de classes dépend du nombre de valeurs N dont on dispose.
Le nombre de classes K peut être déterminé par la formule suivante :

Qualité/CFM2 Page 3
avec N : l'effectif de l'échantillon ( nombre de valeurs).
c) Calcul de l'étendue de classes
 Calculer l’étendue de mesure Wt du prélèvement.
Wt = (Valeur maxi - Valeur mini) dans le prélèvement.
 Calculer l'étendue de classe Ht
Ht = Wt / Kt
L'étendue théorique de classes doit être arrondi à un multiple de la résolution de l’instrument
de mesure, par exemple:
- un micromètre a une résolution 0,001 ou 0,01

-un pied à coulisse (1/50) a une résolution 0,02

d) Calcul de la valeur limite inférieure de la 1ère classe

La valeur limite inférieure de la 1ère classe de l’histogramme est égale à la plus petite valeur

moins la moitié de la résolution.

Li1= valeur mini - (résolution /2)

e) Calcul de la valeur limite supérieure de la 1ère classe

La valeur limite supérieure de la 1ère classe de l’histogramme est égale à sa limite inférieure
plus l'étendue de classe.
Ls1= Li1 + Ht
Remarque : la limite supérieure est exclu
f) Calcul du centre de classe
La valeur du centre de classe est égale à (la somme de ces deux limites) / 2
Cc= (Li + Ls)/2
g) Construction de l’histogramme
On calcule les paramètres des autres classes en remplissant le tableau suivant:

Qualité/CFM2 Page 4
La construction de l’histogramme est réalisée en comptant le nombre de valeurs dans chaque classe
(effectif de chaque classe) et en représentant un rectangle de hauteur proportionnelle à ce nombre et de
largeur proportionnelle à l'étendue de classe.

Exercice

Qualité/CFM2 Page 5
3) Interprétation en utilisant la lois normale
La distribution de beaucoup de paramètres industriels correspond souvent à une loi normale. On compare
souvent l'histogramme obtenu au profil « en cloche » de la loi normale. Cette comparaison est visuelle et
même si elle peut être une première approche, elle ne constitue pas un test de « normalité ». Pour cela, il
faut exécuter un test dont un des plus classiques est la droite de Henry.
La distribution suivant la loi normale, si elle est extrêmement fréquente, n'est pas systématique. On
vérifiera que la distribution ne correspond pas à une distribution de défaut de forme (exemple : mesure de
l'excentration dans un tube, position d'objets lancés dans la direction d'un mur dont certains rebondissent
sur ce mur).

a) Les paramètres de la loi normale


Une loi normale est caractérisée par deux types de paramètres :
• Les paramètres de position
• Les paramètres de dispersion
 Les paramètres de position
Ces paramètres servent à caractériser l'ordre de grandeur et permettent également de caractériser la position
de la distribution.
La moyenne arithmétique d’un ensemble de n valeurs x est égale à :

Avec N: effectif de la série xi: valeur


La médiane est la valeur telle qu’il y a autant de valeurs d’un coté que de l’autre:

Qualité/CFM2 Page 6
• Si le nombre de classe est impair, on détermine la classe médiane contenant la valeur de rang
(Kt+1)/2.
• Si le Kt est pair, on détermine la classe médiane formée par la réunion des deux classes contenant les
valeurs de rang (Kt/2)+1 et kt/2.
• On détermine ensuite la médiane par l'interpolation linéaire dans la classe médiane,
soit avec:

N: l'effectif de la série
Nk: l'effectif de la classe médiane
xk: la limite inférieure de la classe médiane
xk+1: la limite supérieure de la classe médiane
Ek: nombre de valeur inférieure à xk.
Le mode permet également de caractériser la position de la distribution. Le mode est le centre
de la classe modale, contenant la fréquence est la plus importante.
Remarque : Dans une répartition de Gauss, les trois paramètres de position sont égaux.
Moyenne = Médiane = Mode

 Les paramètres de dispersion


Ces paramètres servent à étudier la manière dont les valeurs observées fluctuent autour d'une valeur
centrale.
L’étendue (notée R : Range en Anglais) est la différence entre la plus grande des données et la
plus petite. W= R= xi max - xi min
L’écart type est la racine carrée de la moyenne des carrés des écarts à la moyenne.
Il a la même dimension que la variation. la dispersion est proportionnelle à l'écart type (noté σ)

L’écart type estimé à partir d’un échantillon représentatif (noté S ou σn-1)

Liaison entre l’écart type et la courbe de Gauss


L’écart type est égal à la distance entre la moyenne et le point d’inflexion de la courbe.

Qualité/CFM2 Page 7
Toute loi normale peut se ramener à une loi Normale standard par le changement de variable Ceci permet
d'utiliser la table de la loi normale. l’échelle « Z » est égale à 0 pour la moyenne -elle est positive vers la
droite et négative vers la gauche La probabilité d’avoir un événement se situant dans la zone

4) Analyse d'un histogramme

la forme de l'histogramme renseigne sur la normalité e distribution:


• Allure en cloche
• Unimodal
• A peu près symétrique

Dans le cas de non- normalité, il y a présence d’une cause spéciale sauf dans le cas de
tolérance de forme. Pour identifier l’origine de cette non normalité, on peut regarder la forme
de l’histogramme et la comparer aux situations de références suivantes:

Qualité/CFM2 Page 8
Si l'allure générale de l'histogramme ne permet pas d'accepter ou refuser nettement l'hypothèse de
normalité de la distribution, il est nécessaire de faire un test de normalité par La méthode de droite de
Henry ou le test χ2 (Khi 2)

III- La droite de Henry


La droite de henry permet de linéariser la courbe de Gauss (loi normale) en utilisant une échelle Gausso-
arithmétique sur laquelle on reporte les fréquences cumulées.

Qualité/CFM2 Page 9
1)Procédure de traçage
• Pour chaque classe, calculer les fréquences relatives et les fréquences cumulées

• Porter sur un quadrillage gauso-arithmétique les points ( LS,fc), en exploitant au maximum la plage
disponible sur l'axe des X ( Ls)
• Evaluer la qualité de l'ajustement des points autour d'une droite, en éliminant le premier et le dernier
point.
2)Interprétation d'une droite de Henry
Si les points portés au graphique se trouvent sensiblement alignés, on peut alors conclure à la normalité de
la courbe. Si ce n’est pas le cas, cela indique que les données ne sont pas conformes à la distribution
normale que l’on attendant.

Qualité/CFM2 Page 10
Exercice

Qualité/CFM2 Page 11
Qualité/CFM2 Page 12

Vous aimerez peut-être aussi