Vous êtes sur la page 1sur 22

Chapitre 11 Les outils statistiques utilisés en O.S.T.

11. LES OUTILS STATISTIQUES UTILISÉS EN O.S.T.

11.1 NOTIONS FONDAMETALES


La notion fondamentale de la théorie des probabilités est celle d’événement
aléatoire. On appelle événement aléatoire un évènement qui pour certaines
conditions peut soit se réaliser, soit ne pas se réaliser.

11.1.1 Définitions
On appelle fréquence relative p* d’un événement aléatoire A le rapport m* du
nombre de réalisations de cet événement au nombre total n* d’épreuves identiques
réalisées au cours desquelles l’événement donnée aurait pu ou non se produire.
m*
P ( A) = p = *
* *

n
Il découle de l'observation de divers phénomènes que si le nombre d'épreuves
dans chaque série est pratiquement peu élevé, les fréquences relatives de
l'apparition de l'événement A dans chaque série peuvent notablement différer. Si le
nombre d'épreuves dans les séries est élevé, alors, en règle générale, les
fréquences relatives de l'apparition de l'événement A dans les diverses séries
différeront peu les unes des autres et ceci d’autant plus que le nombre d'épreuves
dans les séries est élevé.
L'expérience montre que, dans la grande majorité des cas, il existe un nombre
constant p tel que les fréquences relatives de la réalisation de l'événement A pour un
grand nombre d’épreuves répétées diffèrent très peu, à l’exception de quelques rares
cas, de ce nombre p.
Ce fait empirique s'écrit symboliquement de la manière suivante :
m*
 → p.
n* → ∞
n*
Le nombre p est appelé probabilité de la réalisation de l'événement aléatoire A :
P (A) = p.

11.1.2 Variable aléatoire discrète – Loi de distribution


11.1.2.1 Définitions
La variable aléatoire X prenant à la suite d’une épreuve l’une des valeurs d’une
suite finie ou infinie x1, x2, …, xi, …, est appelée variable aléatoire discrète si à
chaque valeur xi correspond une probabilité pi pour que la variable X prenne la valeur
xi.
Il découle de la définition qu’à chaque valeur xi est associé une probabilité pi.
La relation fonctionnelle liant la probabilité pi à xi est appelé loi de distribution
des probabilités d’une variable aléatoire discrète ou tout simplement « loi de
distribution ». La loi de distribution peut être donnée sous forme d’un tableau, d’un
polynôme de distribution des probabilités ou sous forme analytique : pi = f (xi). Le fait
que la variable aléatoire X prend nécessairement l’une des valeurs x1, x2, …, xi, …,
est un événement certain, de sorte que la condition :
N ∞

∑ p i = 1, dans le cas d’une suite finie, ou :


i =1
∑p
i =1
i
= 1, dans le cas d’une suite infinie de

valeurs.

148
Chapitre 11 Les outils statistiques utilisés en O.S.T.

La valeur de la variable aléatoire à laquelle correspond la plus grande


probabilité est appelée le mode.

11.1.2.2 Espérance mathématique d’une variable aléatoire discrète


On appelle espérance mathématique de la variable discrète X, la somme des
produits de toutes les valeurs possibles de la variable aléatoire par les probabilités
n
respectives de ces valeurs : E ( X ) = ∑ xi p( xi ).
i =1
Physiquement, l’espérance mathématique représente la moyenne pondérée de
la variable X. Ainsi quand le nombre des épreuves croit indéfiniment, la moyenne
arithmétique des valeurs observées de X tend vers son espérance mathématique. La
différence entre la variable aléatoire X et son espérance mathématique E(X), c'est-à-
dire : X – E(X) est une variable aléatoire appelée variable aléatoire centrée ou écart.

11.1.2.3 Variance
On appelle variance de la variable aléatoire X l’espérance mathématique du
carré de la différence de la variable aléatoire X et de son espérance mathématique,
autrement dit l’espérance mathématique du carré de la variable aléatoire centrée
n
correspondante : Var(X) = E([X – E(X)]2) ou Var ( X ) = ∑ [( xi − E ( X )] . p( xi ).
2

i =1

La variance ou fluctuation de la variable aléatoire X, détermine la position du


centre de distribution des probabilités. C’est la caractéristique numérique de la
dispersion, de la déviation des valeurs de la variable aléatoire par rapport à son
espérance mathématique.

11.1.2.4 Ecart quadratique moyen ou écart type


La variance possède l’unité du carré de la variable aléatoire. Il est parfois plus
commode, pour caractériser la dispersion des valeurs, d’utiliser une grandeur dont
l’unité coïncide avec celle de la variable aléatoire, que l’on appelle l’écart quadratique
moyen ou tout simplement l’écart type.
On appelle écart type de la variable aléatoire la racine carré de la variance :
n
σ ( X ) = σ X = Var ( X ) = ∑ [( x − E ( X )] . p ( xi ) .
2
i
i =1

Physiquement l’écart type ou la variance d’une distribution représentent la


dispersion des valeurs de la variable aléatoire autour de sa valeur moyenne
pondérée (E(X)).

11.1.3 Variable aléatoire continue – Densité de probabilité


Pour bien comprendre la question on considère l’exemple suivant : on mesure
l'usure d'un cylindre après une certaine période d’exploitation. Cette grandeur est
déterminée par la valeur de l'accroissement du diamètre du cylindre. Désignons-la
par X. Il découle de la nature même du problème que la quantité X peut prendre
n'importe quelle valeur dans un certain intervalle (a, b) des valeurs possibles. Une
quantité de ce genre est appelée variable aléatoire continue. Considérons donc une
variable aléatoire continue X donnée dans un intervalle (a, b), qui peut être l'intervalle
infini (−∞, + ∞) . Partageons cet intervalle par des points arbitraires x0, x1, x2, …, xi, …,

149
Chapitre 11 Les outils statistiques utilisés en O.S.T.

xn, en petits intervalles de longueur ∆ x i −1 = x i − x i −1 . Nous désignerons la probabilité


de l'appartenance de la variable aléatoire X à l'intervalle (xi-1, xi) par : P (xi-1<X<xi) et
nous la représenterons sous la forme de l'aire du rectangle de base ∆ x i (figure 11.1).
Pour chaque intervalle (xi-1, xi) on détermine la probabilité pour la variable aléatoire X
d'appartenir à cet intervalle, et, par conséquent, on peut construire le rectangle
correspondant. Nous obtenons ainsi une ligne en escalier.
y
P(Xi-1 < X < Xi)

0
x0 x1 xi-1 xi xn-1 xn x

Figure 11.1 : Ligne de distribution des probabilités de la variable aléatoire X

P( x < X < x + ∆x)


Définition : S'il existe une fonction y = f(x), telle que : lim = f ( x) ,
∆x → 0 ∆x
cette fonction f(x) est appelée densité de distribution des probabilité de la variable
aléatoire X, ou loi de distribution, ou encore densité de probabilité. Nous désignerons
par X la variable aléatoire continue, par x ou xi la valeur de cette variable aléatoire.
La courbe y = f(x) est appelée courbe de distribution des probabilités, ou courbe de
densité (figure 11.2).

0 x x+ ∆ x x

Figure 11.2 : courbe de distribution des probabilités de la variable X

Utilisant la notion de limite, on obtient de l'égalité précédente l'égalité


approchée : P(x<X< x + ∆ x) ≅ f(x) ∆ x, aux infiniment petits d'ordre supérieur par
rapport à ∆ x près.
Soit f(x) la densité de probabilité de la variable aléatoire X. Alors la probabilité
pour que la valeur de la variable aléatoire X tombe dans un certain intervalle ( α , β )
est égale à l'intégrale définie de la fonction f(x) entre les limites α et β autrement dit
on a l'égalité :

150
Chapitre 11 Les outils statistiques utilisés en O.S.T.

P ( α <X< β ) = ∫ f ( x)dx
α

Géométriquement parlant cette probabilité est égale à l’aire du trapèze


curviligne correspondant (figure 11.3).

y f (x)

0 α β x

Figure 11.3 : probabilité de la variable aléatoire X d’appartenir à ( α , β )

11.1.4 Fonction de répartition ou loi intégrale de distribution


Soit f (x) la densité de probabilité d’une certaine variable aléatoire X,
x

(−∞ < X < +∞) , alors la fonction F ( x) = ∫ f ( x)dx


−∞
est appelée fonction de répartition

ou loi intégrale de distribution des probabilités.

Pour une variable aléatoire discrète la fonction de répartition est égale à la


somme des probabilités de toutes ses valeurs xi inférieures à x : F ( x) = ∑ p ( x i ) .
xi < x

On voit sur la figure 11.4 que pour une valeur donnée de x, la valeur de la
fonction de répartition est numériquement égale à la l’aire limité par la courbe de
densité, situé à gauche de l’ordonnée menée par le point x.

F(x)
f (x)

0 x x

Figure 11.4 : fonction de répartition

Il découle de la relation précédente que la fonction de répartition est la


probabilité pour que la variable aléatoire X prenne une valeur inférieure à x (figure
11.4) :
F ( x) = P(−∞ < X < x) .

Le graphique de la fonction F(x) est appelé courbe intégrale de distribution (figure


11.5).

151
Chapitre 11 Les outils statistiques utilisés en O.S.T.

F(x)

F(x)

0 x x

Figure 11.5 : courbe intégrale de distribution

La probabilité pour que la variable aléatoire X prenne une valeur appartenant à


l’intervalle ( α , β ) est égale à l’accroissement de la fonction de répartition sur cet
intervalle : P (α < X < β ) = F ( β ) − F (α ) . Notons que la densité de probabilité f (x) et
la fonction de répartition F(x) sont liées par la relation F’(x) = f (x).

11.1.5 Caractéristiques numériques d’une variable aléatoire


• On appelle espérance mathématique d’une variable aléatoire continue X de
+∞
densité de probabilité f (x) l’expression : E ( X ) = ∫ x f ( x)dx . Si la variable aléatoire
−∞
X ne peut prendre des valeurs que dans l’intervalle fini [a, b], l’espérance
b
mathématique E (X) est donnée par la formule : E ( X ) = ∫ x f ( x) dx . On dénomme
a

l’espérance mathématique « centre de distribution » des probabilités de la


variable aléatoire X. Si la courbe de distribution est symétrique par rapport à l’axe
oy, autrement si la fonction f(x) est paire, alors il est évident que :
+∞
E( X ) = ∫ x f ( x)dx = 0 . L’espérance mathématique d’une variable aléatoire centrée
−∞
est nulle.

• On appelle variance de la variable aléatoire continue X l’expression


mathématique du carré de la variable aléatoire centrée correspondante :
+∞

∫ (x − E ( X ) )
2
Var ( X ) = f ( x) dx .
−∞

• On appelle écart type de la variable aléatoire continue X la racine carré de la


+∞
variance : σ ( X ) = Var ( X ) = ∫ (x − E ( X ) )
2
f ( x) dx .
−∞

• On appelle médiane et l’on note Xm le nombre vérifiant l’égalité suivante :


Xm +∞
1
∫−∞ f ( x ) dx = ∫X f ( x)dx = 2 .
m

• La valeur de la variable aléatoire X, pour laquelle la densité de probabilité admet


sa plus grande valeur, est appelée mode et notée m0.

152
Chapitre 11 Les outils statistiques utilisés en O.S.T.

11.1.6 Caractéristiques d’une distribution


11.1.6.1 Définitions
En métrologie, sous l'effet de différents facteurs : humains, techniques
(conception de l'instrument de mesure) si l'on effectue des mesures sensibles et que
l'on recommence un grand nombre de fois ces mesures, on n’obtient jamais le même
nombre, on constate une dispersion que la statistique va permettre de définir dans
certaines conditions.

On retrouve ce même phénomène par exemple, en relevant chaque jour ou


chaque mois les ventes ou les productions d'un article donné dans une entreprise.
Nous rappelons encore ci-dessous quelques définitions de base :
• Variable aléatoire : nom donné à la grandeur sur laquelle portent les
observations ; elle doit être définie de façon précise, et elle est susceptible de
fluctuations.
• Individu : pour mesurer ou repérer la variable prise en considération, on
examine des éléments bien définis. Chaque élément est appelé individu.
• Échantillon : l'ensemble des individus sur lesquels on a effectivement mesuré
ou repéré la variable constitue l'échantillon.
• Population : l'ensemble des individus parmi lesquels on a choisi l'échantillon,
tiré au hasard, constitue la population.
Le scénario qui nous permet de passer des propriétés de l'échantillon à la
population dont il donne une image plus ou mois précise, en fonction de la taille, doit
être celui d'un prélèvement au hasard.
Toutefois, dans la pratique, on ne fait pas toujours des sondages au hasard
dans une fabrication, il arrivera souvent que l'on prenne les pièces à la suite, à la
sortie de la machine. Il faudra alors s'assurer que l'on est dans des conditions
équivalentes à un tirage au hasard, ce que l'on fera en constatant que la loi de
distribution demeure semblable à elle-même au cours de ce tirage.
Ce qui revient à dire que, lorsque la fabrication est stable, le prélèvement
séquentiel est équivalent à un prélèvement au hasard.

11.1.6.2 Relevé des mesures. Existence d'une loi de distribution


Mesurons 100 pièces se suivant à la sortie d'une machine à bois, qui découpe
et calibre les éléments de série constitutifs d'une armoire. Nous obtenons le tableau
ci-dessous (tableau 11.1). Plaçons en ordonnée les valeurs des mesures et en
abscisse leur numéro d'ordre, qui n'est que la transposition du facteur temps. On
obtient un nuage de points pour lequel deux cas peuvent se produire :

- ou bien ce nuage de points a une allure horizontale ;


- ou bien une allure montante ou descendante ou discontinue.
Dans le premier cas, le phénomène est stable ; la fabrication ne se dérègle pas.
Du point de vue mathématique, il existe une moyenne.

Du point de vue statistique, il existe une loi puisque le nuage de points a la


même allure tout au long de l'observation.

Dans l'exemple suivant, du fait du manque de la mesure, les mêmes valeurs se


répètent souvent (tableau 11.1).

153
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Tableau 11.1 : Relevé des mesures effectuées en mm

52,1 52 52,1 51,9 52 52 52 52,3 52 52,2


51,9 52,1 52 52,1 52 52,2 51,9 52 51,9 52,3
52 51,7 52,1 52 51,9 51,9 52,1 52,1 51,9 51,8
52 51,9 52 52,2 52,9 52,1 52 52,3 52,1 52
51,8 52 51,9 52,1 52 52,1 52,1 52,1 51,9 52,2
52 52,2 52 52,3 52,1 52,1 51,9 51,8 52,1 51,8
52 51,9 52,1 51,9 52 52 51,8 51,9 51,9 51,8
51,8 52,1 52 52,2 51,8 51,9 52 52,1 52 52
52,1 51,8 52 52 52,1 52,1 51,9 52,2 52,2 52,2
52,1 52 51,9 52 52,1 51,8 52,2 52 51,9 52

11.1.6.3 Histogramme. Classe et centre de classe


Le dénombrement des résultats implique un pré-découpage sur un axe de
l'étendue totale W des mesures en intervalles de valeur h, dit intervalle de classe. On
choisit h de façon à déterminer au moins 5 intervalles suivant le nombre de mesures
effectuées. En classant les mesures, on obtiendra ni mesures dans l'intervalle i. Si n
est le nombre total des mesures, on appelle densité dans l'intervalle i :
n 1
Densité i = i ×
n h
Le milieu de l'intervalle i est appelé centre de classe xi. On appelle ni classe ou
fréquence.
n
La fréquence relative est : i
n
Dans l'exemple choisi, les mesures varient de 51,7 à 52,3. L'étendue est de 0,6
mm. On prendra 6 intervalles de 0,10 mm en dépouillant les résultats par séries de
10 mesures successives (voir tableau 11.2).

Tableau 11.2

classe Centre de classe xi 1 2 3 4 5 6 7 8 9 10 Total


51,75 à 51,85 51,8 0 0 2 0 1 2 2 2 1 2 12
51,85 à 51,95 51,9 1 3 3 2 2 1 4 1 1 2 20
51,95 à 52,05 52 5 3 2 5 2 2 3 4 2 4 32
52,05 à 52,15 52,1 2 2 2 2 4 3 1 3 4 2 25
52,15 à 52,25 52,2 1 2 0 0 1 1 0 0 2 1 8
52,25 à 52,35 52,3 1 0 0 1 0 1 0 0 0 0 3
100

Le mode de distribution - c'est-à-dire la fréquence la plus grande - est de 52


mm.

La moyenne est x =
∑n i xi
= 52,009 mm
100
Par ailleurs, l'examen des différentes séries montre la stabilité de la fabrication,
les étendues étant sensiblement constantes.

154
Chapitre 11 Les outils statistiques utilisés en O.S.T.

11.1.6.4 Courbe de distribution


A partir des centres de classes et des fréquences relevées, on peut construire
l'histogramme de distribution des fréquences : ensemble de rectangles ayant pour
base un intervalle de classe, pris égal à l'unité et pour hauteur la fréquence.

On obtient ainsi un contour tendant vers une courbe quand n croîtra vers l'infini
et que l'on prendra des intervalles de plus en plus petits.

En rapportant les fréquences à n, on a les fréquences relatives dont la valeur se


stabilise quand n croît vers l'infini et se confond avec la probabilité de trouver une
pièce dans l'intervalle de classe correspondant, lorsqu'on effectue un tirage au
hasard.
La courbe ajustée est dite de « densité de probabilité » f(x) (figure 11.6)
+∞
Sa surface totale : ∫ f ( x) dx
−∞
est égale à l'unité.

La surface de la courbe comprise entre deux droites perpendiculaires à l'axe


des x mesurera, par exemple, la qualité de la fabrication comprise entre deux
tolérances, c'est-à-dire le pourcentage de pièces bonnes.

Si on prend 52 ≤ xi ≤ 52+0,5, on obtient une estimation du pourcentage de pièces


bonnes qu'on peut lire sur l'histogramme :
1/2x32% + 26% + 8% + 3% + 53% = 53%

Donc estimation du taux de rebuts : 47 %.

Figure 11.6 : Courbe de distribution

Notons tout de suite que la courbe tracée en tirets traduit de façon approchée la
loi de distribution de Laplace-Gauss.

155
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Ici, une translation de 0,25 permettrait de placer presque toute la surface


d'histogramme entre les limites des tolérances : nous aurions 97% des pièces dans
les tolérances et 3% de rebuts hors tolérance. On voit l'importance de la loi de
distribution dans la mesure de la qualité.

On emploie plus fréquemment la représentation graphique des pourcentages


cumulés, en trait plein sur la figure 11.6, représentant la fonction intégrale F(x) de la
loi de distribution f(x). Le pourcentage des pièces dont la valeur est inférieure ou
égale à une tolérance ou limite x donnée représente la probabilité pour qu'une pièce
au hasard soit inférieure à x.
On lit : p(x ≤ 52,05) = 63 %.

11.1.6.5 Caractéristiques de centrage et de dispersion


a- Définitions
On rappelle, encore une fois que, la variable aléatoire est une variable X qui
peut prendre les valeurs x1, x2, …. xn, avec, pour chacune de ces valeurs, une
probabilité : p(x1), p(x2), ….. p(xn).
i =n
L'ensemble de ces probabilités étant tel que : ∑ p( x ) = 1
i =1
i

La variable aléatoire est symbolisée par X et ses valeurs xi.


Les probabilités correspondent aux fréquences relatives de la loi de distribution.

b- Caractéristiques de centrage
Calcul de la moyenne : en pratique, on dispose de n mesures x1, x2, …. xn,
relevées sur l’échantillon.
i=n

∑x i
La moyenne est alors : x = i =1

Lorsqu'on effectue la répartition par classe, on dispose de n classes chacune

de valeur centrale xi et de fréquence ni. On a alors : x =


∑ ni x i
∑ ni
ni
représente alors la fréquence relative de chaque valeur xi, estimation de
∑ ni
sa probabilité.
Si l'échantillon devient égal à la population N, ∑ ni = N, on a alors la moyenne
vraie ou espérance mathématique :
m = E (X) = x1 p (x1 ) + x2 p (x2 ) + ……… + xi p(xi ) + ……. + xn p (xn )

c- Caractéristiques de dispersion
On distingue l'écart type, calculé sur la population N :
i =n

∑ (x − m)
2
i
σ= i =1

N −1

156
Chapitre 11 Les outils statistiques utilisés en O.S.T.

N - 1 représente le nombre de variables indépendantes, puisque les N valeurs


sont liées entre elles par la relation de la moyenne.

Pratiquement, on disposera de l'estimation calculée sur l'échantillon :


i=n

∑ (x − x)
2
i
σ= i =1

n −1

Pour n > 30, on prend la valeur simplifiée :


i=n

∑ (x i − m)
2

σ= i =1

n
Pratiquement, le calcul est conduit ainsi :
∑ (xi − x ) = ∑ xi2 − 2 x ∑ xi + n x 2
2

Mais : ∑x = nx i

∑ (x − x ) = ∑ x
2
i
2
i − n x2

qui pourra être rendu aussi précis qu'il est nécessaire.

On note qu’on peut simplifier le calcul en remarquant que la dispersion des


valeurs xi est indépendante du choix de l'origine. On prendra alors pour origine une
valeur x0, entière la plus voisine de la valeur modale et une unité de longueur égale à
un intervalle de classe h.
x − x0
Les nouvelles valeurs seront : xi' = i
h
i=n

∑x '2
i
On calculera : σ' = i =1
− x '2
n

Et σ = h σ'

11.2 LES LOIS DE PROBABILITÉS USUELLES


11.2.1 La loi binomiale B (n, p)
On considère une épreuve, un évènement A dont la probabilité est p. On
recommence n fois cette épreuve, et soit X la variable aléatoire qui comptabilise le
nombre de fois où l’évènement A s’est produit. Alors X suit une loi de binomiale.

P ( X = k ) = C nk p k (1 − p )
n−k

n!
C nk représente la combinaison de k éléments parmi n. C nk = .
(n − k ) ! k !
Les tables statistiques donnent P (X = k) en fonction de n, p et k (voir l’annexe).

157
Chapitre 11 Les outils statistiques utilisés en O.S.T.

En dehors de l’expérimentation, la théorie permet de déterminer directement la


probabilité pour qu’étant donnée un élément de proportion p dans un ensemble N, on
obtienne k de ces éléments si on effectue n tirages.
L’hypothèse fondamentale consiste donc à ne pas modifier la composition du lot
N. Celle-ci implique un tirage avec remise ou tirage dit « non exhaustif ». On assimile
le tirage d’un échantillon de taille n sans remise à un tirage « non exhaustif » si n/N
≤ 0,1.
Supposons que l’on ait p % de pièces défectueuses dans un lot et que l’on tire
un échantillon non exhaustif de taille n, la loi binomiale B (n, p) donne la probabilité
d’avoir k éléments défectueux dans l’échantillon.

♦ Domaine d’application : domaine industriel, contrôle de qualité et soudage.


♦ Caractéristiques
• Espérance mathématique : E (x) = np.
• Variance : Var (x) = σ x2 = np (1 – p).
♦ Fonction cumulée
x=k
P( x ≤ k ) = ∑ C nx p x (1 − p )
n−x

x=0

♦ Exemple
Pour réaliser le montage d’un système électronique, on dispose de résistances
issues d’une production importante, où l’on sait que le pourcentage P de
défectueuses est de 5 %. On doit utiliser 4 résistances.
1) Quelle est la probabilité d’en avoir 3 de mauvais ?
2) Quelle est la probabilité d’en avoir un nombre inférieur ou égal à 3 de
mauvais ?
• Solution
n
≤ 0,1 ; on peut appliquer la loi binomiale.
N
1) P (k = 3) = C 43 × 0,05 3 × (1 − 0,05) = 0,005
1

k =3
2) P (k ≤ 3) = ∑ C 4k × 0,05 k × (1 − 0,05)
4−k
= 1 − P (k = 4) = 0,9999
k =0

11.2.2 La loi de poisson P (m)


On considère une épreuve ; A un évènement tel que P (A) = p ≤ 10 %
(probabilité de A faible). On répète un grand nombre de fois cette épreuve (n > 50).
Soit X la variable aléatoire qui comptabilise le nombre d’apparition de l’évènement A,
alors X suit une loi de Poisson de paramètre m = np.
mk e−m
P( X = k ) =
k!
Ce qui revient à dire qu’on peut remplacer ou approximer la loi binomiale par la
loi de Poisson, quand p est petit, par exemple p ≤ 0,1 et n assez grand de sorte que
np<18. Dans ce cas, la taille du lot N est grande ou infinie, mais on connaît la
proportion P d’éléments défectueux. De ce fait, on sait que le nombre moyen
défectueux auquel on peut s’attendre dans l’échantillon est de m.
La probabilité d’avoir k défectueux dans un échantillon est donnée par P (X = k)
qui est donnée dans les tables statistiques (voir l’annexe).

158
Chapitre 11 Les outils statistiques utilisés en O.S.T.

♦ Domaine d’application : domaine industriel.


♦ Caractéristiques
• Espérance mathématique : E (X) = m.
• Variance : Var (X) = m.
♦ Fonction cumulée
x=k
m x e−m
P( x ≤ k ) = ∑
x=0 x!
♦ Exemple
Sur une machine de production, on sait qu’il y a en moyenne 10 pannes par
semaine.
Quelle est la probabilité qu’il y ait 0 panne lors d’une journée de
démonstration ?
• Solution
m = 10/2 = 2 pannes/jour.
m0 e− 2
P( X = 0) = = 0,135
0!

11.2.3 La loi de Gauss (loi normale ou loi de Laplace-Gauss)


Une variable aléatoire X de moyenne m et d’écart type σ suit une loi normale
N(m, σ 2 ), si et seulement si la densité de probabilité (ou la fonction de densité) est
2
1 x−m
1 − 
2 σ 

donnée par : f ( x) = e ; qui est l’équation générale de la courbe de
σ 2π
densité de distribution. Cette courbe est symétrique par rapport à la moyenne m qui
est également valeur modale et médiane. Elle comporte deux point d’inflexion x = m
± σ (voir figure 11.7).

On peut approximer la loi binomiale par la loi de Laplace-Gauss, quand n est


grand sans que p ou q soient trop petits, c'est-à-dire qu’on a npq > 18, (q est la
probabilité complémentaire de p ; q = 1 – p), on a alors l’expression suivante :
2
1  k − np 
− 
1 2  npq 
P( X = k ) = e où : n p q = σ et np = m
2π n p q

♦ Domaine d’application
- Domaine industriel : longueur d’une poutre, diamètre d’un rivet ;
- D’une manière générale : toute grandeur relative à des objets fabriqués en série
dans des conditions telles que les facteurs de variation sont nombreux (vibration,
température, hygrométrie, etc.), mais, qui interviennent d’une manière
infinitésimale lorsqu’ils sont pris isolément.
- Elle est applicable aussi à la répartition des valeurs de nombreux phénomènes :
taille d’une population, poids, durée de vie, qui dépendent de nombreux facteurs.

♦ Caractéristiques
• Espérance mathématique : E (x) = m.
• Variance : Var (x) = σ 2 .

159
Chapitre 11 Les outils statistiques utilisés en O.S.T.

♦ Représentation graphique (voir figure 11.7)


Cette fonction est symétrique par rapport à la moyenne : f (m – x) = f (m + x).
D’autre part, on connaît le pourcentage de la population compris entre − kσ et + kσ
autour de la moyenne.

f(x)

68,56%

95,45%

99,73%
0 x
m
σ σ
2σ 2σ

3σ 3σ

Figure 11.7 : Courbe de densité de distribution

♦ Calcul des paramètres de la loi normale N (m, σ )


Pour modéliser la loi normale, il est nécessaire de connaître ou d’estimer :
• m : la moyenne.
• σ : l’écart type.
Cela se fait sur un échantillon ; plus celui-ci est grand plus la précision est
bonne. Ainsi on a :
1 i=n
m = X = ∑ Xi
n i =1
i=n

∑ (X − X ) qui est l’écart type « biaisé ».


1 2
Et : σ n = i
n i =1

Pour un petit échantillon, il est préférable de prendre l’écart type « non biaisé » :
1 i=n
σ n −1 = ∑ (X i − X )2
n − 1 i =1

160
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Dans le cas de données groupées, où l’on a ri fois la valeur de Xi, l’écart type
« non biaisé » devient :

1 i=k
∑ ri ( X i − X )
2
σ n −1 =
n − 1 i =1

♦ Exemple 1

Xi 9 10 8 9,7 10,5 9,5

• N=6

• σ n −1 =
1
5
[
(9 − 9,45)2 + (10 − 9,45)2 + ....... + (10,5 − 9,45)2 + (9,5 − 9,45)2 ]
• σ n −1 = 0,868
• σ n = 0,793

♦ Exemple 2

ri 3 2 1 1 4 5
xi 9 10 8 9,7 10,7 9,5

i=k
• n = ∑ ri = 16
i =1

• σ n −1 =
1
15
[
3 (9 − 9,637 ) + 2 (10 − 9,637 ) + ....... + 4 (10,5 − 9,637 ) + 5 (9,5 − 9,637 )
2 2 2 2
]
• σ n −1 = 0,695
• σ n = 0,672

♦ Fonction cumulée ou fonction de répartition


Cette fonction représente la répartition des pourcentages cumulés des éléments
dont les valeurs sont inférieures à une valeur x, ou la probabilité pour xi ≤ x. On a :
2
x 1 x−m
1 −  

∫σ
2 σ 
F ( x) = e dx
−∞ 2π

Cette intégrale ne se calcule pas directement ; seules des méthodes


numériques (méthode de Simpson) permettent de trouver les résultats. Dans
certaines calculatrices, les modules statistiques exécutent cette opération. Une autre
façon de résoudre ce problème est d’utiliser les tables statistiques de la loi normale
(0, 1), en faisant un changement de variable en variable centrée réduite u :

x−m
u= . La table N (0, 1) donne les valeurs de F (u), en se rappelant que F (-
σ
u) = 1 – f (u).

161
Chapitre 11 Les outils statistiques utilisés en O.S.T.

11.2.4 La loi normale réduite centrée


x−m
On pose : u = , c'est-à-dire qu’on prend m pour origine et σ pour unité
σ
de mesure. Une table unique pourra alors servir pour toutes les lois de Gauss (m, σ ).

1 u 1
1 − u2 1 − u2
On a : f (u ) =e et : F (u ) = ∫
2
e du , dont les valeur sont
2

2π −∞ 2π
données par la table jointe en annexe. La figure 11.8 ci-dessous en donne les
éléments essentiels.

11.2.5 Vérification d’une distribution gaussienne : droite de Henry


La définition de la loi normale réduite montre que l’on peut passer d’une loi de
distribution (m, σ ) cumulée à une autre (m’, σ ' ) par une translation, m – m’, et le
changement d’échelle :
σ ' nouvelle échelle
=
σ ancienne échelle

Cette propriété a été utilisée par Henry pour transformer la courbe de Gauss de
probabilités totales cumulées en une droite, tangente en son point d’inflexion. En
projetant, en ordonnée, les pourcentages cumulés portés sur cette tangente, on
obtient une graduation, dite gaussienne, et un système de coordonnée gausso-
logarithmique, figurant sur des imprimés appelés diagrammes de la droite de Henry.
On peut, grâce à ces imprimés, vérifier qu’une distribution est gaussienne :
- On portera, en abscisse, les valeurs des extrémités de la classe, et en
ordonnée les pourcentages cumulés correspondants ;
- Si les points obtenus sont alignés, on a affaire à une distribution gaussienne ;
- Si on obtient plusieurs segments de droite, on met en évidence l’influence de
plusieurs facteurs sur le caractère étudié.
On peut également vérifier qu’une distribution est gaussienne grâce au test de
Khi-deux ( χ 2 ) dont le calcul est relativement long.

11.3 LOI DE DISTRIBUTION GAUSSO-LOGARITHMIQUE OU LOI DE GALTON


Cette loi représente la distribution de nombreux caractères économiques,
industriels et biologiques. Dans ce type de distribution, c’est le logarithme du
caractère x étudié qui suit une loi normale de Gauss.
x1, x2 étant deux valeurs du caractère, posons : y1 = log x1, y2 = log x2.
Donnons à y1 et y2 une variation égale à dy = log (1 + q). Nous aurons :
y1 + dy = log x1 + log (1 + q) = log x1(1 + q)
y2 + dy = log x2 + log (1 + q) = log x2(1 + q)
A la même variation du logarithme correspondent des variations du caractère
proportionnelles de ce caractère.
La loi de Galton suppose donc, en général, que les effets sont proportionnels à
la valeur du caractère étudié. Pour cette raison, on appelle aussi cette loi : loi de
l’effet proportionnel de Gibrat. Au contraire, la loi normale de Gauss régit les
ensembles de caractère où les variations sont la somme d’effets nombreux et
indépendants, du même ordre de grandeur.

162
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Propriétés
• Si log xi est la moyenne des log x1, …, log xn, on a :
log x1 + log x 2 + ......... + log x n
log xi = = log n x1 x 2 .... x n
n
xi
• On démontre la relation suivante : log x = log xi + 1,151σ log xi où : x = ∑
2

n
On vérifie qu’une distribution est gausso-logarithmique en traçant la droite de
Henri sur du papier spécial gausso-logarithmique qu’on trouve dans le commerce.
Cette loi de distribution est particulièrement répandue dans tous les
phénomènes de production. Par exemple :
- Distribution des valeurs des produits en stock,
- Poids des différentes pièces fabriquées par un atelier,
- Et également, temps de fabrication des pièces différentes réalisées dans un
atelier.

f(u)

u
0
-3 -2 -1 0,5 1 2 3
69,15%
84,13%
F(u) =
97,72%
99,86%

Figure 11.8 : Fonction de répartition de la loi normale réduite

11.4 LOI DE PARETO OU COURBE A.B.C.


La loi Pareto, dite loi ABC ou loi des 20/80, a été mise au point et utilisée par
l’italien Wilfred Pareto (1848-1923), précurseur de l’économie mathématique. Elle
illustre nombreuses répartitions dans divers domaines, en voici quelques exemples :
- 20 % des conducteurs ont 80 % des accidents ;
- 25 % des voies ferrées voient passer 75 % du trafic ;
- 15 % des articles vendus représentent 75 % du chiffre d’affaires, mais, aussi, en
corollaire, 50 % des articles ne représentent que 15 % du chiffre d’affaires ;

163
Chapitre 11 Les outils statistiques utilisés en O.S.T.

- 20 % des machines ont 75 % des défaillances enregistrées ;


- 20 % des rechanges en magasin représentent 85 % des immobilisations ;
- 15 % des bons de travaux couvrent 65 % des heures d’atelier, mais, aussi, en
corollaire, 55 % des bons de travaux ne couvrent que 20 % de la charge du
travail.

La méthode ABC permet donc au gestionnaire d’identifier des cibles d’actions


prioritaires, mais également de déterminer les éléments négligeables pour alléger
l’étude. Elle permet de définir les priorités d'actions. L'analyse ABC peut être
également mise à profil en gestion des stocks ou dans toute organisation demandant
de faire un choix. C'est un outil d'aide à la décision.

Cette loi traduit simplement le fait que le caractère étudié est distribué suivant
une loi gausso-logarithmique. Au lieu de tracer un histogramme, on range les valeurs
du caractère par ordre décroissant et on en calcule le pourcentage cumulé C par
rapport au total.

a) Méthode
Les éléments seront classés par ordre d'importance en indiquant les
pourcentages pour un critère déterminé. Cette étude nécessite une approche en trois
étapes :

‰ Définir la nature des éléments à classer


Les éléments à classer dépendent du caractère étudié. Ces éléments peuvent
être : des matériels, des causes de pannes, des natures de pannes, des bons de
travail, des articles en stock, etc.

‰ Choisir le critère de classement


Les critères les plus fréquents sont les coûts et les temps, selon le caractère
étudié, d'autres critères peuvent être retenus tels que :
ƒ Le nombre d'accidents, le nombre d'incidents ;
ƒ Le nombre de rebuts, le nombre d'heures d'utilisation ;
ƒ Le nombre de kilomètres parcourus ;
ƒ La valeur consommée annuellement, souvent nécessaire pour la gestion des
stocks
ƒ Etc.

‰ Définir les limites de l'étude et classer les éléments

b) Représentation graphique
Généralement ; 20 % du nombre des éléments représentent 80 % du critère
étudié : c'est la classe A, les 30 % suivant du nombre des éléments représentent 15
% du critère étudié : c'est la classe B et les 50 % restant du nombre des éléments
représentent seulement 5 % du critère étudié : c'est la classe C.

En cumulant les valeurs décroissantes du critère étudié, la courbe ABC fait


apparaître trois zones d'où l'appellation de "courbe ABC" (voir figure 11.9).

Sur le plan statistique, notons qu’il est sans intérêt de tracer une courbe ABC
sur une dizaine de produits : il est plus simple de les classer et d’analyser chacun
d’eux.

164
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Critère

100 %
95 %

80 %

A B C

0 20 % 50 % 100 % Eléments

Figure 11.9 : Courbe ABC

c) Exemples d'application
♦ Exemple 1
On considère l’exemple des valeurs annuelles des articles fabriqués par un
même atelier, on obtient le classement suivant qui a été directement rangé par des
valeurs décroissantes :

Rang Code Désignation Valeurs des Valeurs % cumulé % cumulé


article sorties cumulées des articles des sorties
1 0817 Collier 40 000 40 000 2,32 21,13
2 4022 Arbre 32 000 72 000 5,88 38,03
3 4625 Excentrique 28 000 100 000 8,82 52,82
4 2041 Couvercle 20 000 120 000 11,76 63,38
5 7117 Plaque 16 200 136 200 14,70 71,94
6 2712 Ressort 12 000 148 200 17,65 78,28
7 1511 Pignon 8 000 156 200 20,58 82,50
8 4215 Axe 6 200 162 400 23,53 85,79
9 3831 Joint 4 000 166 400 26,47 87,89
10 1159 Tampon 3 200 169 600 29,41 89,58
11 2312 Goupille 2 400 172 000 32,35 90,85
12 3460 Chicane 2 200 174 200 35,29 92,01
13 9281 Ailette 2 000 176 200 38,23 93,06
14 5572 Graisseur 1 600 177 800 41,17 93,91
15 2013 Bâti 1 500 179 300 44,11 94,71
16 8891 Goujon 1 200 180 500 47,05 95,34
17 1744 Glissière 1 000 181 500 50,00 95,87
18 0417 Longuette 1 000 182 500 52,94 96,39

165
Chapitre 11 Les outils statistiques utilisés en O.S.T.

19 1215 Boulon 800 183 300 55,88 96,82


20 2936 Embase 750 184 050 58,82 97,22
21 1833 Levier 600 184 650 61,76 97,53
22 9862 Bague 550 185 200 64,70 97,82
23 8460 Filtre 530 185 730 67,64 98,10
24 1417 Grille 500 186 230 70,58 98,37
25 6352 Carter 450 186 680 73,53 98,37
26 8622 Encoche 430 187 110 76,47 98,83
27 3873 Bloc 400 187 510 79,41 99,04
28 4114 Clavette 350 187 860 82,35 99,23
29 1017 Support 320 188 180 85,29 99,39
30 5572 Ecrou 300 188 480 88,23 99,55
31 2960 Rondelle 260 188 740 91,17 99,69
32 7017 Cale 250 188 990 94,12 99,82
33 6004 Entretoise 180 189 170 97,06 99,92
34 3367 Tuyau 150 189 320 100 100

Nombre d’articles
7 17 34
100
189320
% Cumulé des sorties

181500
90

80 156200

70
sorties cumulées
Valeurs des

60

50

40

30

A B C
20

10

0
0 10 20 30 40 50 60 70 80 90 100
% Cumulé des articles

Figure 11.10 : Courbe ABC

166
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Ceci permet de tracer la courbe ci-dessus, dite en général courbe ABC (voir
figure 11.10), qui permet de classer les valeurs en trois classes, constituant un
moyen simple de distinguer quels sont les produits les plus importants.

♦ Exemple 2
On considère le listing suivant des heures de maintenance d'un atelier de
fabrication mécanique.

a) Etablir la courbe ABC des heures de maintenance cumulées


b) Quelles conclusions peut-on tirer de l'examen de cette courbe ?

Centre de Désignation des centres de charge Heures de


charge maintenance
10 Ligne de montage n°1. 2 338
20 Robot peinture. 4 283
30 Perceuse. 415
40 Electricité. 82
50 Transfert linéaire n°2. 5 683
60 Contrôle fabrication. 183
70 Fours à traitements thermiques. 555
80 Fraiseuse à reproduire (poste n°13). 362
90 Tours à reproduire (poste n°12). 294
100 Presses. 2 609
110 Robot soudure. 1 832
120 Ligne de montage n°2. 2 416
130 Matériels de transport interne. 2 113
140 Transfert circulaire n°2. 1 114
150 Extrudeuses (poste n°5). 808
160 Transfert linéaire n°1. 1 545
170 Matériels de contrôle. 154
180 Equipement contre l'incendie. 107
190 Alimentation air comprimé. 889
200 Transfert circulaire n°1. 1 205
210 Fraiseuses à C.N. (poste n°17). 1 623
220 Alimentation eau. 13
230 Alimentation vapeur. 438
240 Tours à C.N. (poste n°11). 1 585
250 Entretien des bâtiments. 722

ƒ On dresse le tableau récapitulatif de la courbe ABC suivant.

Centre Heures Rang Classe. Centre de % Heures Cumul H. %


De charge de Mce. Décrois. charge cumulé de Mce. Mce. cumulé
10 2 338 1 5 50 4 5 683 5 683 17,03
20 4 283 2 2 20 8 4 283 9 966 29,86
30 415 3 18 100 12 2 609 12 575 37,68
40 82 4 24 120 16 2 416 14 991 44,91
50 5 683 5 1 10 20 2 338 17 329 51,92

167
Chapitre 11 Les outils statistiques utilisés en O.S.T.

60 183 6 21 130 24 2 113 19 442 58,25


70 555 7 16 110 28 1 832 21 274 63,74
80 362 8 19 210 32 1 623 22 897 68,60
90 294 9 20 240 36 1 585 24 482 73,35
100 2 609 10 3 160 40 1 545 26 027 77,98
110 1 832 11 7 200 44 1 215 27 242 81,62
120 2 416 12 4 140 48 1 114 28 356 84,95
130 2 113 13 6 190 52 889 29 245 87,62
140 1 114 14 2 150 56 808 30 053 90,04
150 808 15 12 250 60 722 30 775 92,20
160 1 545 16 14 70 64 555 31 330 93,86
170 154 17 10 230 68 438 31 768 95,18
180 107 18 22 30 72 415 32 183 96,42
190 889 19 13 80 76 362 32 545 97,50
200 1 205 20 11 90 80 294 32 839 98,38
210 1 623 21 8 60 84 183 33 022 98,93
220 13 22 25 170 88 154 33 176 99,39
230 438 23 17 180 92 107 33 283 99,71
240 1 585 24 9 40 96 82 33 365 99,96
250 722 25 15 220 100 13 33 378 100%

ƒ Tracé de la courbe ABC (voir figure 11.11).

% cumulé d'H. de Mce.


100.00
90.00
80.00
70.00
60.00
50.00
40.00
30.00
20.00 A B C
10.00
0.00 Rang
0.00 5.00 10.00 15.00 20.00 25.00

Figure 11.11 : Tracé de la courbe ABC

168
Chapitre 11 Les outils statistiques utilisés en O.S.T.

Nous constatons que 5 centres de charge (50, 20, 100, 120 et 10) représentant
20 % des éléments correspondent à 52 % des heures de maintenance (critère
étudié). Le fait d'agir dans un premier temps sur ces 5 centres de charge permettra
de résoudre 52 % de notre problème.

Les résultats obtenus permettent de prendre des décisions en matière de


maintenance ; on se préoccupe davantage des éléments de la catégorie A, c'est pour
ceux-ci que l'on organise une politique de maintenance préventive systématique ou
préventive conditionnelle avec une surveillance permanente des points clefs :
- on améliore la fiabilité de ces machines ;
- on prévoit des stocks de pièces de rechange avec une plus grande attention.

Pour les éléments de la catégorie B, on sera moins exigeant sur les méthodes
de prévention.

Enfin, ceux de la catégorie C n'exigeront pas ou peu de maintenance


préventive.

169