Vous êtes sur la page 1sur 18

Phase 2 : Démarche de Résolution

de problèmes

Définir et poser le problème


L’histogramme

Diagramme à barres verticales

Introduction
C'est un diagramme à barres verticales et le graphique le plus
courant ur représenter la répartition statistique d'une série de données ou de mesures concernant une
même grandeur.
Il est aussi utilisé pour analyser les caractéristiques d'une population (valeur moyenne, dispersion ou
étalement, comportement, tendances, etc.).
L’histogramme est un outil de troisième nécéessité pour voir plus large un problème.

A. Utilité de l’outil
Il consiste à représenter des colonnes (rectangles) de largeurs identiques. La surface de la colonne sera
proportionnelle à la fréquence correspondante.

Fréquence
(Nbre de pièces
défectueuses) 18
0 2 4 6 8 10 12 14 16 18 20

14
12
10

6
5
3 3

A B C D E F G H Types de défauts
Intervalle

Figure 11: Histogramme de répartition des types de défauts

1
Notons que l’histogramme exige que la caractéristique à contrôler soit mesurable

B. Types de caractéristiques à contrôler et données


Le type de contrôle que l'on veut mettre en oeuvre dépend des caractéristiques que l'on veut étudier; on
peut les subdiviser en deux classes:
− Caractéristiques mesurables
− Caractéristiques non mesurables mais dénombrable
Les données associées à des caractéristiques mesurables sont dites de type continu comme par exemple,
diamètre, poids, durée de vie, chiffre d’affaires, déterminée, viscosité,... Ces caractéristiques peuvent
prendre des valeurs dans un intervalle fini ou infini, ce sont des variables continues.
Les données associées à des caractéristiques dénombrables sont dites de type discret, comme par
exemple, nombre d'unités non conformes, nombre de non-conformités, pourcentage de non conformes,...
Ces caractéristiques ne prennent qu'un nombre limité de valeurs, souvent des valeurs entières; ce sont
des variables discrètes.
Dans les sections qui vont suivre, nous abordons certaines techniques descriptives d'analyse de données
qui sont les plus utilisées en milieu industriel. Nous indiquons comment caractériser une caractéristique
de qualité par certaines statistiques importantes et par certaines figures et graphiques appropriés.

C. Dépouillement des données : distribution de fréquences absolues et histogramme


A partir d'un ensemble de données associé à une caractéristique importante d'un procédé, on veut être
en mesure d'effectuer une présentation succincte et intelligible des valeurs de la caractéristique.
Une façon simple de résumer une série de données est de les ranger en ordre croissant (cette étape n'est
pas essentielle, mais peut faciliter le dépouillement) les dépouiller selon une distribution de fréquences
absolues visualiser ce dépouillement à l'aide d'un histogramme.

Cette première analyse permet de localiser le centre de la distribution des valeurs de la caractéristique
ainsi que d'obtenir une bonne idée de l'éparpillement (variation) des valeurs.
Bien que les logiciels existant sur le marché permettent d'obtenir rapidement une distribution de
fréquences absolues ainsi que le tracé de l'histogramme, nous illustrons quand même la procédure à
suivre puisqu'il arrive fréquemment qu'en usine, le responsable de l'ajustement de certaines
caractéristiques fasse lui-même ce dépouillement et apporte les correctifs qui s'imposent s'il y a lieu.

1) Dépouillement et distribution de fréquences absolues


Le groupement des données en classes dans lequel on indique par un trait vertical chaque donnée
appartenant à sa classe respective s'appelle dépouillement des données. Il est également de pratique
courante de dépouiller les données par bloc de 5 (s'il y a lieu). La somme du nombre de traits appartenant
à chaque classe donne la fréquence absolue de cette classe (ce qui correspond au nombre de données
appartenant à cette classe). La répartition des données dans les classes accompagnées des fréquences
absolues respectives s'appelle la distribution de fréquences absolues ou distribution des effectifs.
Lorsqu'on veut grouper une série de données suivant une distribution de fréquences absolues, l'on doit
fixer au préalable le nombre de classes dans lesquelles les valeurs sont réparties. Un peu d'expérience et
les quelques conseils qui suivent peuvent faciliter la tâche.

2
2) Détermination du nombre de classes
Mentionnons d'abord que le nombre de classes ne devrait, en général, être ni inférieur à 5 ni supérieur à
20. De préférence, il variera entre 6 et 12 classes.
Ce choix est fonction du nombre de données à dépouiller et l'éparpillement des données.
On pourrait se servir du tableau ci-contre pour établir le nombre de classes.

Nombre de données n Nombre de classes k


< 50 5à7
50 à 100 6 à 10
100 à 250 7 à 12
> 250 10 à 20
Tableau 1: Table de détermination du nombre de classes
(Table d’Ishikawa) (*)

(*) Kaoru Ishikawa,"La gestion de la qualité Outils et applications pratiques" Edition Dunod 1990

Remarque :
Le nombre de classes peut être détermié à partir de la relation suivante : k = n 1/2

Encore faut-il arrondir par excès la valeur de n à fin de pouvoir affecter toutes le obervations "les
données" à toutes les classes correspondantes.
3) Détermination de l'amplitude de chaque classe
Ici pour éviter toute confusion dans la présentation des résultats ainsi que dans les représentations
graphiques qui peuvent suivre, on s'assurera dans la mesure du possible que chaque classe est présentée
avec la même amplitude.
Pour trouver l'amplitude des classes, on peut procéder comme suit:
Noter, à l'aide du tableau précédent, le nombre k de classes souhaitable d'après le nombre de
1
données à dépouiller.
Déterminer la plus grande (xmax) et la plus petite valeur (xmin) de la série et calculer par la suite
2
l'étendue de la série comme suit : E = xmin -xmax.
On divise alors l'étendue de la série par le nombre de classes souhaité: E/k. Ceci donne une
idée de l'amplitude que devrait avoir chaque classe. Comme ce résultat sera rarement un
3 nombre entier, nous l'arrondissons au plus grand ou au plus petit entier. Le choix définitif de
l'amplitude de chaque classe s'effectuera dans le but d'assurer le plus de clarté possible et de
faciliter la présentation et la compréhension de la distribution de fréquences.

On peut visualiser la distribution de fréquences à l'aide de l’histogramme.

4) Histogramme
L'histogramme est une représentation graphique de la distribution de fréquences et est constitué de
rectangles juxtaposés dont chacune des bases est égale à l'intervalle de chaque classe et dont la hauteur
est telle que la surface soit proportionnelle à la fréquence absolue ou relative de la classe correspondante.
Dans le cas où les classes sont de même amplitude, hauteur = fréquence.

Remarques

3
On obtient la fréquence relative (en %) de chaque classe en divisant la fréquence absolue n ou effectif
de chaque classe par n, la taille d'échantillon:
fi % = (fi/n) x 100.
Ou bien fi % = (ni/n) x 100.

Dans le cas d'amplitude de classe inégale, il faut rectifier les hauteurs comme suit pour que la surface
de chaque rectangle soit proportionnelle à la fréquence:
Si l'amplitude d'une classe de fréquence absolue f est m fois plus grande (ou plus petite) que l'amplitude
de base, son rectangle aura pour hauteur f/m (ou m . f).
Ainsi, dans la distribution suivante:
Classes Fréquences
10 – 20 5
20 – 25 4
25 – 30 8
...

Le tracé de l'histogramme aura comme hauteur, pour la première classe, 5/2 = 2,5 puisque l'amplitude
de cette classe est le double (amplitude = 10) par rapport aux autres classes (amplitude=5).

5) Exemple : Dépouillement du poids en grammes d'un point d'étanchéité


Les données suivantes représentent le poids en grammes d'un joint d'étanchéité obtenu d'un procédé
continu et utilisé dans la fabrication d'automobiles, chaque valeur correspond à une période de
fabrication de 30 secondes. La variation dans l'écoulement du caoutchouc provenant de l'extrudeuse
affecte directement les dimensions du joint d'étanchéité. Quarante données ont été obtenues sur une
période de production d'environ 30 minutes et elles représentent la taille de l'échantillon (n = 40).

Données obtenues sous les conditions habituelles d'opération


269,7 267,0 264,8 267,1 268,7
263,6 265,6 261,4 265,5 261,2
264,4 268,8 264,5 264,5 263,1
259,7 260,3 266,2 262,2 264,6
262,4 263,4 265,9 271,0 258,7
263,4 267,6 265,3 264,4 262,3
260,7 264,1 266,4 269,8 261,2
265,0 272,9 255,8 266,1 262,1
Tableau 2: Poids en gramme

On veut établir la distribution de fréquences absolues du poids en grammes.


1 Puisque n = 40, le nombre de classes souhaité est k = 6.
La plus grande valeur de la e est: xmin = 255,8.
2
L'étendue de la série est donc: E = 272,9 - 255,8 = 17,1.
L'amplitude de chaque classe devra être égale à E/k = 17,1/6 = 2,85 ≈ 3
3 Comme la plus petite valeur de la série est 255,8, on pourrait fixer la borne inférieure de la
première classe à 255,5 avec une amplitude de 3 grammes pour chaque classe.

4
On obtient alors les classes suivantes:
255,5 ≤ Poids < 258,5
258,5 ≤ Poids < 261,5
261,5 ≤ Poids < 264,5
264,5 ≤ Poids < 267,5
267,5 ≤ Poids < 270,5
270,5 ≤ Poids < 273,5
De cette manière, la borne supérieure n'est jamais incluse dans sa classe; toutes les classes
sont mutuellement exclusives, chaque donnée appartenant à une seule classe dans le
dépouillement. On pourrait se servir de la feuille suivante pour faciliter le dépouillement.

Feuille de dépouillement
Distribution de fréquences
Absolues
Caractéristique : Poids en Pièce no. :……………………………
grammes Identification: Joint - caoutchouc
Spécifications:…………… Procédé: Extrusion
Taille de l'échantillon: 40 Département:
Date: 12/05 Extrusion 742
Fréquence
Effectif Fréquence
Classes Dépouillement cumulée
ni (fi %)
(Fci↑%)
255,5 - 258,5 / 1 2,5 2,5
258,5 - 261,5 //// // 7 17,5 20,0
261,5 -264,5 //// //// / 11 27,5 47,5
264,5 -267,5. //// //// //// 14 35,0 82,5
267,5 - 270,5 //// 5 12,5 95,0
270,5 - 273,5 // 2 5,0 100,0
Total n=40 100%
Tableau 3: Le point d étanchéité (mesure du poids en gramme)

La fréquence cumulée Fc↑% correspond, dans notre cas, au pourcentage de données de la série qui sont
inférieures à la borne supérieure de la classe. Puisque l'amplitude de chaque classe est la même, on
obtient alors l'histogramme suivant, en utilisant les fréquences absolues en ordonnée et les intervalles
de classes en abscisse.
Le point d étanchéité (mesure du poité) choisi selon la table de détermination du nombre de classes ou table
d’Ishikawa

6) Histogramme du poids en grammes

5
18
16
14
Effectif 12
(Fréquence 10
absolue)
8
6
4
2
0

Figure 12: Histogramme du poids en grammes

La valeur centrale d'une classe ou point milieu s'obtient en ajoutant, à la limite inférieure de la classe, la
moitié de l'amplitude de la classe. On obtient ici 255,5 + 3/2 = 257 pour la première classe; les autres
centres de classe sont 260 263 266 269 272. On pourrait également présenter l'histogramme en indiquant
les centres de classe au lieu des limites de chaque classe.

7) Histogramme avec les centres de classes

18
16
14
Effectif
(Fréquence 12
absolue) 10
8
6
4
2
0
257 260 263 266 269

Figure 13: Histogramme du poids en grammes avec les centres de classes

On constate qu'un pourcentage important des données se situe entre 261,5 et 267, la valeur centrale du
poids se situant autour de 264 g, on constate également l'étalement des données soit entre 255 et 273 g,
avec aucun trou dans la distribution ou encore avec aucune valeur extrême.
Remarques

1) Dans le tracé d'un histogramme, il est conseillé de ne pas confondre sur le dessin l'axe des ordonnées
(fréquences absolues ou relatives) et le premier rectangle de l'histogramme. Il y a donc lieu de séparer
l'origine des abscisses de l'origine des ordonnées.

2) Il faut également préciser que le mode de représentation d'une série de données (variable continue) à

6
l'aide d'une distribution de fréquences absolues et d'un histogramme admet comme hypothèse
simplificatrice, la répartition uniforme des données à l'intérieur de chaque classe. En définitive, les
valeurs regroupées dans la même classe se verront attribuer la même valeur, soit celle du centre de la
classe.
3) Si on veut comparer des histogrammes constitués à partir d'échantillons de tailles différentes, il sera
alors préférable d'utiliser en ordonnée, les fréquences relatives au lieu des fréquences absolues.

D. Utilisation de l'histogramme pour décrir et contrôler un processus


L'histogramme est un outil statistique relativement efficace pour donner une "image" du comportement
d'un procédé industriel. A cause de sa simplicité, il a l'avantage d'être compris facilement, même pour
les non-initiés aux notions de statistique.
L'opérateur d'une machine dont il est responsable du réglage fait une découverte sensationnelle lorsqu'on
peut lui représenter, visuellement, le comportement d'une certaine caractéristique correspondant à la
pièce qu'il fabrique.

E. Quelles informations peut-on obtenir d'un histogramme?


L'histogramme permet de déceler du premier coup d'oeil où se trouve la concentration des valeurs
observées, les extrêmes qui se rencontrent plus rarement, l'allure globale de la distribution des
données,...
En particulier, il permet d'indiquer d'une manière assez juste les principales caractéristiques du procédé
de fabrication,
− En Indiquant Le Centre Du Processus;
− En indiquant l'étalement des données, ce qui permet d'obtenir une bonne idée de la dispersion des
valeurs (aspect important qui permet d'évaluer la précision du processus de fabrication par
exemple).

F. Utilité de l'histogramme en industrie


L'utilisation de l'histogramme (ou de la distribution de fréquences absolues) dans le domaine industriel
peut donc servir:
− À vérifier le réglage d'une machine.
− À indiquer les mesures correctives à apporter en début de production.
− À mesurer les effets des mesures correctives.
− À évaluer si une machine peut produire en conformité avec les normes spécifiées pour la
caractéristique que l'on contrôle.
− À déterminer s'il y a un mélange de matières premières possédant des propriétés différentes.
− À comparer différents opérateurs affectés au même processus.
− À comparer différents fournisseurs (contrôle de réception).

Remarque. Pour obtenir une appréciation plus complète des principales valeurs du processus
(centre et dispersion), on doit calculer certaines mesures descriptives (comme la moyenne et l'écart-
type). Ces notions sont traitées dans les prochaines Sections.

G. Mesures de tendance centrale et de dispersion


Bien que l'histogramme (ou le diagramme en feuilles) nous donne une information précieuse sur une
caractéristique de qualité, il ne permet pas de préciser avec exactitude la valeur centrale de la
caractéristique ainsi que la dispersion.

7
Pour compléter la caractérisation d'une variable statistique, on a recours principalement à deux types de
mesures:
− Mesures de tendance centrale
− Mesures de dispersion (ou de variabilité)
Les mesures de tendance centrale permettent d'obtenir une idée juste de l'ordre de grandeur des valeurs
ainsi que de la valeur centrale de la caractéristique de qualité.
Les mesures de dispersion permettent d'autre part de quantifier l'éparpillement des valeurs de la
caractéristique et de préciser ainsi l'ampleur avec laquelle les valeurs observées s'écartent les unes des
autres ou s'écartent de leur valeur centrale.
Les mesures les plus utilisées en milieu industriel sont résumées dans le tableau ci-après.

Moyenne
Tendance arithmétique
centrale Médiane
Mode

Etendue
Dispersion Ecart type
Coefficient de
variation

Figure 14: Mesures utilisées en milieu industriel

H. Définitions des mesures de tendance centrale

1) Moyenne arithmétique
La moyenne arithmétique, que nous notons X ̅ d'une série numérique x1, x2, x3, x4, est la somme des
valeurs de la série divisée par le nombre n :

𝑥1 + 𝑥2 + 𝑥3 + … … . . . . 𝑥𝑛 ∑ni=1 𝑥𝑖
̅=
X =
𝑛 n
̅ se lit «x barre», ∑(grand sigma) désigne la somme de.
Le symbole X

∑𝑘𝑖=1 𝑓𝑖 . 𝑥𝑖 ∑𝑘𝑖=1 𝑓𝑖 . 𝑥𝑖
̅=
X =
∑𝑘𝑖=1 𝑓𝑖 1

Si la caractéristique prend les valeurs distinctes xi (ou encore si les valeurs sont groupées en classes avec
xi comme centres de classe), avec un certain nombre de répétitions ni (fréquence absolue de la valeur xi
ou de la classe où se situe le centre xi ou ci), on utilise alors l'expression suivante:
k représentant le nombre de valeurs distinctes de la série ou encore le nombre de classes de la série
groupée.

2) Médiane
La médiane, notée Me ou encore X, est la valeur (observée ou possible) de la caractéristique dans la série
de données ordonnée en ordre croissant ou décroissant, qui partage cette série en deux parties, chacune
comprenant le même nombre de données de part et d'autre de la médiane.

8
Nombre impair de données(non groupées en classes): la médiane correspond alors à la (n+1)ème̸ 2 valeur
de la série ordonnée. Il y a donc (n-1) ème̸ 2 valeurs de chaque côté de la médiane.
Nombre pair de données(non groupées en classes): Dans ce cas la médiane sera la moyenne
arithmétique des deux valeurs centrales dans la série ordonnée. Ainsi si n = 2k, la médiane est la
moyenne des ke et (k+1)e valeurs.

Dans le cas où les données sont groupées en classes, on peut obtenir la médiane en effectuant une
interpolation linéaire à l'intérieur de la classe médiane; on utilise alors l'expression ou méthode suivante:
: Interprétation de la méthode

Me = BI + a . [ (n ̸ 2) – F ] ̸ fMe
BI Borne inférieure de la classe médiane
N Le nombre total de données dans la série
La somme des fréquences absolues de toutes
F
les classes précédant la classe médiane
fMe La fréquence absolue de la classe médiane
A L'amplitude de la classe médiane
Tableau 4: Interprétation de la méthode

Pour déterminer la classe médiane, il s'agit de déterminer la quantité n/2 (ce qui correspond à 50% des
données) et on compare cette valeur avec les fréquences cumulées. La classe médiane sera celle dont la
fréquence cumulée englobe la n/2 ième donnée (celle dont la fréquence cumulée lui est immédiatement
supérieure ou égale mais non inférieure).

3) Mode
La mode (ou valeur dominante), noté Mo, est la valeur de la variable la plus fréquente que l'on constate
dans une série. Dans le cas d'une variable discrète, la détermination du mode est immédiate. Dans le cas
d'une variable continue dont les données ont été groupées en classes, la détermination du mode est peu
objective et est plutôt laissée à l'arbitraire. Dans ce cas, on parle plutôt de classe modale, classe à laquelle
correspond la fréquence (absolue ou relative) la plus élevée. Par convention, on pourrait dire que le
mode est alors la valeur qui correspond au centre de classe modale.

4) Définition des mesures de dispersion


a) Étendue
L'étendue est la différence entre la plus grande et la plus petite valeur de la série (d'un échantillon ou
d'un sous-groupe) E = Xmax - Xmin

Cette mesure ne tient compte que des valeurs extrêmes de la série; on note également qu'elle est
indépendante du nombre de données dans la série. Elle est toutefois peu utilisée lorsque le nombre de
données est de 10 et plus. Cette mesure de dispersion est fréquemment employée en suivi et contrôle
statistique des processus (partie 3).

b) Variance et écart-type
La dispersion des valeurs xi de la série autour de leur moyenne x est obtenue en calculant la somme des
carrés des écarts des valeurs xi par rapport à x, divisée par (n-1). Cette mesure s'appelle la variance de
la série de valeurs (ou de l'échantillon) et s'écrit:

9
∑𝑛𝑖=1(𝑥𝑖 − ̅
X)2 ∑𝑛𝑖=1 𝑥𝑖 2 − (∑ 𝑥𝑖 )2 ⁄𝑛
𝑆2 = =
𝑛−1 n−1

La racine carrée de s2 donne l'écart-type : S= √𝑆 2

La moyenne arithmétique et l'écart-type s'expriment dans la même unité de mesure que celle des valeurs
xi de la caractéristique observée. Une série qui est peu dispersée autour de la moyenne arithmétique (ce
qui est souhaitable en contrôle industriel) conduit à une valeur d'écart-type faible.
Dans le cas de valeurs distinctes xi ou valeurs groupées en classes avec xi comme centres de classe et
fréquence absolue fi, on utilise l'expression suivante pour le calcul de la variance :

2
∑ 𝑓𝑖 𝑥𝑖 2 − (∑ 𝑓𝑖 𝑥𝑖 )2 ⁄𝑛
𝑆 =
𝑛−1

c) Coefficient de variation

Le coefficient de variation, que nous notons CV, est obtenu en divisant l'écart-type par la moyenne
arithmétique x barre. Exprimé sous forme d'un pourcentage, il s'écrit :

𝐂𝐕 = S × 100, X
̅≠0
̅
𝐗

Il est indépendant de l'unité de mesure de la caractéristique observée. Si X est négative, on retiendra


alors la valeur absolue de CV. Plus le coefficient de variation est faible, plus la série de données est
homogène (concentrée autour de X ), indiquant ainsi que la moyenne X est bien représentative de
l'ensemble des données de la série.

10
Vitesse V1

Diamètre moyen = X =
 xi = 0,148 + 0,147 + 0,147 + 0,145 + ......... + 0,145 = 1,756 = 0,14633.
12 12 12
L' étendue E = 0,148 − 0,145 = 0,003.

 x − ( x ) 0,256976 − (1,756 ) / 12
é 2 2
/n
Variance = s =2 i i
= = 0,0000013 :
11
L' écart − type = 0,0000013 = 0,00114.

 100 = 0,77 9 % (moins de 1% ).


s 0,00114
Coefficient de variatio n CV % = C 100 =
x 0,14633

Vitesse V 2
1,789
X = = 0,1490833
12
E = 0,151 − 0,147 = 0,004.
0,266727 − (1,789 ) / 12 0,0000169
2
s2 = = = 0,0000015.
11 11
s = 0,0000015 = 0,00124.
0,00124
CV % =  100 = 0,832%.
0,1490833

Vitesse V3
On pourra vérifier que l' on obtient les mesures descriptiv es suivantes :
X = 0,15292, E = 0,004, s 2 = 0,0000013, s = 0,00114, CV % = 0,761%..
I. Synthèse des mesures descriptives selon les vitesses de l’extrudeuse
(Diamètre extérieur des tubes)
V1 V2 V3
Moyenne 0 ,14633 0 ,1490833 0 ,15292
Etendue 0 ,003 0 ,004 0 ,004
Ecart-type 0 ,00114 0 ,00124 0 ,00114
CV % 0 ,789% 0 ,832% 0 ,761%
Tableau 5: Diamètre extérieur des tubes

11
J. Exercices
Exercice : 1
Dans un procédé de fabrication de tubes thermoplastiques, on a obtenu les valeurs suivantes pour le
diamètre extérieur des tubes selon trois vitesses de fabrication, sous l'influence de divers facteurs de
production :

V1 V2 V3
0,148 0,148 0,148 0,148 0,148 0,148 0,148 0,148 0,153 0,152 0,152 0,153

0,145 0,145 0,145 0,145 0,149 0,149 0,149 0,149 0,154 0,154 0,152 0,152

0,147 0,147 0,147 0,147 0,149 0,149 0,149 0,149 0,153 0,151 0,154 0,155

Tableau 6: Données concernant les vitesses de fabrication

Calculer la moyenne arithmétique, l'étendue, la variance, l'écart-type et le coefficient de variation pour


le diamètre extérieur des tubes selon chaque vitesse de l'extrudeuse.
Solution
Exercice : 2

Calcul de la moyenne et de la variance - données groupées


Les données suivantes représentent la tension de démarrage en volts d'une lampe fluorescente; quarante
valeurs ont été obtenues.

Tension
0 91 92 93 94 95 96 97 98 99
(xi)
Nombre de lampes :
01 02 02 12 07 09 04 00 02 01 40
Effectif ni
Fréquence : fi
Tableau 7: Données concernant la tension de démarrage
en volts d'une lampe fluorescente

a) Déterminer la moyenne et la variance en utilisant les expressions pour valeurs groupées :

∑𝑘𝑖=1 𝑓𝑖 . 𝑥𝑖 ∑𝑘𝑖=1 𝑓𝑖 . 𝑥𝑖
̅=
X =
∑𝑘𝑖=1 𝑓𝑖 1
:
∑ 𝑓𝑖 𝑥𝑖 2 − (∑ 𝑓𝑖 𝑥𝑖 )2 ⁄𝑛
𝑆2 =
𝑛−1

12
Pour faciliter le calcul, utiliser le tableau suivant:

xi xi2 ni fi fixi fixi 2


0 01 0,025
91 02 0,05
92 02 0,05
93 12 0,3
94 07 0,175
95 09 0,225
96 04 0,1
97 00 00
98 02 0,05
99 01 0,025
01 0,025

Tableau 8: Détermination de la moyenne e t de la variance

̅ = … … ….
a) X , S 2 =…………..
b) Déterminer le coefficient de variation (en %). CV =
c) Quelle est la valeur modale de cette série de données?

Solution
a) X =93,35 ; s2= 3,8774
b) CV = 2,11 %
c) 92

Exercice : 3

Détermination de la durée de vie médiane d’un produit


On a soumis à un essai de fiabilité 12 produits identiques, pour lesquels on a trouvé les durées de vie
suivantes en heures.

76 157 116 85 120 285 211 159 184 138 92 101

Comme la durée de vie varie largement, la moyenne arithmétique ne sera pas tellement représentative.
Déterminons plutôt la valeur médiane.

Rangeons la série en ordre croissant:


76 85 92 101 116 120 138 157 159 184 211 285

Puisque le nombre d'observations est pair, n = 12 = 2k, la médiane est la moyenne de la 6e et 7e


observation dans la série ordonnée.

Me = [120 + 138] ̸ = 129 heures. On peut donc dire qu'il y a six produits qui ont une durée de vie
inférieure à 129 heures et 6 qui ont eu une durée de vie supérieure à 129 heures.

13
Exercice : 4

Détermination de la valeur médiane d'une série groupée


La répartition du poids (X) en grammes de cinquante tubes en matière céramique est résumée dans la
distribution de fréquences absolues suivante. Compléter le tableau en ajoutant les fréquences cumulées
croissantes et déterminer la valeur médiane du poids.

Poids en grammes Nombre de tubes Fréquences cumulées


Moins de 1,45 5
1,45 < X < 1,60 8 cumulées
Fréquences
1,60 < X < 1,75 10
1,75 < X < 1,90 15
1,90 < X < 2,05 9
2,05 < X < 2,20 2
2,20 et plus 1
Tableau 9: Distribution des fréquences absolues de 50 tubes en matière céramique

a) Quelle est la classe médiane?


b) Indiquer quelles sont les valeurs pour les quantités suivantes:
BI =……………., n=……………., F =……………. , f Me% =………………., a =…………….
c)______________________ Calculer la médiane à l'aide de l'expression suivante:

Me = BI + a . [ (n ̸ 2) – F ] ̸ fMe

a) Solution

Poids en grammes Fréquences cumulées


Moins de 1,45 5
1,45 ≤ X < 1,60 8
1,60 ≤ X < 1,75 10
1,75 ≤ X < 1,90 15
1,90 ≤ X < 2,05 9
2,05 ≤ X < 2,20 2
2,20 et plus 1
Tableau 10 : Distribution des fréquences cumulées croissantes

La classe médiane est 1,75 ≤ X < 1,90.


ii) BI =1,75, n=50, F =23, f Me% =15, a =0,15
iii) Me=1,77g

Remarques.

a) L'expression de la médiane pour des valeurs groupées en classes suppose que les valeurs dans la
classe médiane y sont uniformément distribuées.
b) On ne peut calculer la moyenne arithmétique dans le cas d'une distribution en classes ouvertes comme
c'est le cas pour l'exercice 1.5, on doit alors utiliser la médiane comme mesure de tendance centrale.
c) La médiane, contrairement à la moyenne arithmétique, n'est pas influencée par les valeurs extrêmes
éventuellement très grandes ou très petites. Elle est toutefois influencée par le nombre de données.

14
d) Si la caractéristique est discontinue, il se peut qu'il n'y ait pas de valeur médiane. La médiane doit
correspondre à une valeur possible de la caractéristique.

e) Une distribution est symétrique si les données de la caractéristique sont également dispersées de part
et d'autre d'une valeur centrale. Dans le cas d'une distribution symétrique, on a
moyenne = médiane = mode. Si l'asymétrie est positive, alors X > Me> Mo, si l'asymétrie est négative, X
< Me< Mo.

Exercice : 5

L'entreprise métallo fabrique des tiges métalliques utilisées a travers le pays par différents clients dans
l'assemblage de certains montages de structure métallique. une caractéristique importante de ces tiges est la
résistance a la traction qui permet de juger de la capacité des tiges a supporter un certain effort.

Le processus de fabrication de l'entreprise fournit des tiges d'une bonne qualité mais nous remarquons
néanmoins que la résistance a la traction peut fluctuer légèrement de tige en tige. cette fluctuation est
attribuable a plusieurs facteurs dont les propriétés mécaniques des matières premières, légères rainures
dans les tiges,... un contrôle effectué sur trente-cinq tiges fabriquées donna les résistances a la traction
présentées dans le tableau ci-après, mesures effectuées a l'aide d'une machine d'essai statique.

390 384 340 385 381


384 376 420 404 355
423 361 317 383 427
437 365 380 370 382
292 470 409 396 498
378 376 349 402 364
331 342 386 412 408
Tableau 11: Données concernant la résistance à la traction (kg/cm2)

a) Identifier la caractéristique de qualité.


b) Quelle est l'unité de mesure de la caractéristique en cause?
c) Ranger les données en ordre croissant.
d) Quelle est la résistance a la traction la plus faible? la plus elevée?
e) Quelle est l'étendue de la série?
f) Quel est le nombre souhaité de classes pour la distribution de fréquences absolues? quelle sera alors
l'amplitude des classes?
g) En utilisant 290 comme limite inférieure de la première classe et 35 comme amplitude de classe,
dépouiller les données suivant une distribution de fréquences absolues, en notant que x représente la
résistance a la traction des tiges.
h) Dans quelle classe se situe le plus grand nombre de tiges?

Exercice : 6

Dans un atelier de fabrication, on a mesuré la dureté rockwell après trempe de soixante pièces
mécaniques. les données en ordre croissant sont présentées dans le tableau suivant.

15
50,9 51,4 51,9 52,5 52,9 53,0
53,5 53,6 53,8 54,0 54,0 54,2
54,4 54,6 54,6 54,6 54,7 54,7
54,9 55,0 55,0 55,1 55,1 55,2
55,2 55,2 55,2 55,4 55,5 55,5
55,6 55,6 56,0 56,0 56,1 56,2
56,2 56,3 56,4 56,5 56,6 56,7
56,7 56,9 57,0 57,1 57,1 57,2
57,4 57,6 57,8 58,0 58,1 58,3
58,9 59,0 59,3 60,0 60,2 60,6
Tableau 12: Données concernant la mesure de la dureté rockwell après trempe

a) Dépouiller ces données suivant une distribution de fréquences absolues en utilisant une dureté de 50,5
comme limite inférieure de a première classe et 1,5 comme amplitude ce chaque classe.
b) Quelle est la dureté de la pièce la plus douce? quelle est la dureté de la pièce la plus dure?
c) On précise que les pièces se trouvant dans les intervalles suivants sont classées douces, moyennes,
dures.
pièces douces: dureté comprise dans l'intervalle 50,5 < x < 53,5
pièces moyennes: dureté comprise dans l'intervalle 53,5 < x < 56,5
pièces dures: dureté comprise dans l'intervalle 56,5 < x < 61.
combien de pièces se classent dans chacune de ces catégories?

Exercice : 7

L'entreprise gimtek fabrique des plaques chauffantes d'usage domestique. toutefois l'entreprise
s'approvisionne de thermostats de contrôle d'un fournisseur américain.
Un contrôle de réception est effectué par 10,1 11,3 12,4 12,1 13,0 12,6
un technicien qui vérifie, a l'aide d'un 10,6 13,8 12,6 12,0 13,4 11,1
echantillon de trente thermostats, la 10,8 14,1 10,6 11,3 11,5 11,9
température minimale a laquelle une plinthe 11,6 9,6 11,0 12,9 12,0 12,0
chauffante peut opérer avec ces thermostats. 10,0 12,3 12,8 11,8 11,3 12,4
les résultats sur le contrôle d'un récent lot Tableau 13: Données concernant la température en °c
reçu par l'entreprise sont présentés dans le
tableau ci-contre.
a) Ce contrôle porte-t-il sur une grandeur mesurable ou dénombrable?
b) Ordonner les valeurs observées (ordre croissant).
c) Quelle est l'étendue de température de cet echantillon?
d) Dépouiller ces données en utilisant 9,6 comme limite inférieure de la première classe et 0,8 comme
amplitude de chaque classe.
e) Tracer l'histogramme.
f) L'entreprise gimtek applique dans le contrôle des thermostats, la règle de décision suivante:
− si 1 thermostat dans l'échantillon n'opère qu'à une température minimale de 14°c ou plus, le lot est
complètement vérifié.
− si 2 thermostats ou plus dans l'échantillon n'opèrent qu'à une température minimale de 14°c ou
plus, le lot est retourné au fournisseur sans plus de vérification.
d'après les résultats du contrôle effectué par le technicien, quelle action doit-on envisager ?

K. Étude de cas : Utilisation de l’histogramme pour le réglage d’une machine

16
La société "Luminor" fabrique des ampoules incandescentes. Pour ce faire, la machine M12 émet une
certaine quantité de poudre spéciale sur les parois inférieures des ampoules, pour les rendre opaques.
Plus la couche de la poudre est épaisse, plus l’ampoule est opaque. La mesure de l’opacité est obtenue
en mesurant la déflexion d’un jet de lumière passant à travers l’ampoule. Plus la déflexion est élevée,
plus l’opacité est faible. La déflexion souhaitée est comprise dans l’intervalle [22 ; 28].
Monsieur Ali, responsable de la machine M12 obtient pour 40 ampoules les déflexions suivantes
(échantillon rangé).
23,1 24,5 24,9 25,3 25,7 26,0 26,5 26,7
23,4 24,6 25,0 25,5 25,7 26,0 26,6 27,0
23,7 24,8 25,2 25,5 25,8 26,2 26,6 27,3
24,3 24,8 25,3 25,6 25,9 26,4 26,7 28,2
24,3 24,8 25,3 25,7 25,9 26,4 26,7 28,5
Tableau 14: Données concernant la déflexion

a) Remplissez la fiche de dépouillement pour ces données ?


n = ……………. Donc k =………………… et A =……………..

Caractéristique relevée : Agent : …………………………………….


Taille de l’échantillon : n = …….. Lieu/Machine : ……………………..
Date : ……/……/2006 Observation : …………………………
Ci
Centre ni ni Ci ni Ci2 fi % fCi  = Fi
Classes
classe
N° Intervalle

 ni = n  ni Ci  ni Ci2  fi
Total

Tableau 15: Exemple de fiche structurée de dépouillement des données

a) Tracez l’histogramme des fréquences absolues et relatives ?


b) Combien y-a-t-il de valeurs sous 22 ? Combien y-a-t-il de valeurs sur 28 ?
c) Quelle est la valeur de la moyenne ? interprétez ?
d) Quelle est la valeur de la médiane ? interprétez ?
e) Quelle est la valeur du mode ? interprétez ?
f) Qu’en déduisez-vous sur la forme de la distribution de la déflexion mesurée ?
g) Quelle est l’étendue des données ? la variance et l’écart-type ? interprétez ?
h) Quelle devrait être la moyenne pour avoir un intervalle respecté [22 ; 28] ?
i) Combien de valeurs sont inférieures à 25 ? Combien de valeurs sont supérieures à 25 ?

17
j) Le chef de production dit à monsieur Ali que la machine M12 émet plus de poudre qu’il ne faut.
Qu’en pensez-vous ?
k) Que conseilleriez-vous à Monsieur Ali ?

Nombre de classes ( ou intervalles) k ?


Mentionnons d'abord que le nombre de classes ne devrait, en général, être ni inférieur à 5 ni supérieur à
20. De préférence, il variera entre 6 et 12 classes.
Ce choix est fonction du nombre de données à dépouiller et l'éparpillement des données.

L. Conclusion de la phase 2 démarche de résolution de problèmes

Cette phase débouche sur une définition du coeur du problème, documentée et validée. Elle permet de
s’assurer des points clés suivants :
− A-t-on recueilli et analysé les données pertinentes ?
− A-t-on focalisé sur le coeur du problème ?
− Cette vision est-elle partagée au sein de l'organisation ?

18

Vous aimerez peut-être aussi