Vous êtes sur la page 1sur 137

UNIVERSITÉ DE REIMS CHAMPAGNE-ARDENNE

ÉCOLE DOCTORALE SCIENCES DU NUMERIQUE ET DE L'INGÉNIEUR (620)

THÈSE
Pour obtenir le grade de

DOCTEUR DE L’UNIVERSITÉ DE REIMS CHAMPAGNE-ARDENNE

Discipline : MATÉRIAUX, MÉCANIQUE, STRUCTURES

Présentée et soutenue publiquement par

Hassane HOTAIT

Le 13 novembre 2020

Contribution au processus de surveillance intelligente des machines tournantes : cas des


roulements à billes.

Thèse dirigée par XAVIER CHIEMENTIN ET LANTO RASOLOFONDRAIBE

JURY
M. Xavier CHIEMENTIN, Maître de Conférences HDR, URCA, Directeur de thèse

M. Lanto RASOLOFONDRAIBE, Maître de Conférences HDR, URCA, Co-Directeur de thèse

Mme Lamiaâ EL MENZHI, Professeur Habilité, ENSAT Tanger (Maroc) , Rapporteur

M. Antoine GRALL, Professeur des Universités, UTT Troyes , Rapporteur

M. Fabrice BOLAERS, Professeur des Universités, URCA, Examinateur

M. François GUILLET, Professeur des Universités, Université Jean Monnet, Saint-Etienne, Examinateur
Production scientifique

En plus de ce mémoire de thèse, ces travaux ont conduit aux publications et communications
suivantes :

AUTEUR DE REVUES SCIENTIFIQUES

 Hassane Hotait, Xavier Chiementin, and Lanto Rasolofondraibe. "AOC-OPTICS: Automatic Online
Classification for Condition Monitoring of Rolling Bearing." Processes 8, no. 5 (2020): 606.
 Hassane Hotait, Xavier Chiementin, Mouchaweh Moamar Sayed, and Lanto Rasolofondraibe.
"Monitoring of Ball Bearing Based on Improved Real-Time OPTICS Clustering." Journal of Signal
Processing Systems (2020): 1-17.

PARTICIPATION AUX CONGRES SCIENTIFIQUES

 Hassane Hotait, Xavier Chiementin, and Lanto Rasolofondraibe. "Optimization automating


monitoring based on classification for rolling bearing." Vibroengineering PROCEDIA 31, May 7-8,
2020 in Dublin, Ireland: 15-20.
 Hassane Hotait, Xavier Chiementin, and Lanto Rasolofondraibe. "Stratégie de surveillance des
machines tournantes par classification en temps réel des signatures vibratoires." Congrès Français
de Mécanique ,26-30 août 2019 in Brest, France.

1
Dédicaces

La vie est si étrange avec ses revers et ses détours comme chacun de nous a pu
L’apprendre un jour, et beaucoup qui ont été abattus par un échec auraient pu
Réussir s’ils avaient persévéré.

A la mémoire de ma mère que j’ai perdu dans le début de la troisième année


de ma thèse.

J’aurais tant aimé que vous soyez présents.


Que Dieu ait vos âmes dans sa sainte miséricorde
Toutes les lettres ne sauraient trouver les mots qu’il faut…
Tous les mots ne sauraient exprimer la gratitude,
Je promets de perpétuer votre mémoire, Tant que je suis dans la vie.
Aucune dédicace ne saurait exprimer mon respect, mon amour éternel et ma
considération pour les sacrifices que vous avez consenti pour mon instruction et
mon bien être.

À Mon père

Je vous remercie pour tout le soutien et l’amour que vous me portez depuis mon
enfance et j’espère que votre bénédiction m’accompagne toujours.
Que ce modeste travail soit l’exaucement de vos vœux tant formulés, le fruit de
vos innombrables sacrifices, bien que je ne vous en acquitterai jamais assez.
Puisse Dieu, le Très Haut, vous accorder santé, bonheur et longue vie et faire en
sorte que jamais je ne vous déçoive.

2
Remerciements
Je tiens tout d’abord à remercier mon directeur de thèse Xavier Chiementin. Merci de m’avoir consacré
énormément du temps et d’efforts pour que je puisse accomplir cette thèse dans les meilleures
conditions possibles. Merci de m’avoir aidé à traduire mes idées parfois incohérentes en des mots et
expressions compréhensibles.

Mon co-directeur de thèse Lanto RASOLOFONDRAIBE, Je vous remercie pour ton soutien et ta patience
tout au long de cette thèse. Merci pour l’encouragement, les conseils et la disponibilité. J’ai
énormément appris à votre côté pendant ces trois ans.

Professeur Antoine GRALL et Professeure Lamiaâ EL MENZHI, je vous remercie de l’honneur que vous
m’avez fait en acceptant d’être rapporteurs dans mon jury. Je vous suis reconnaissant de votre temps
consacré à l’évaluation de mon travail.

Mes remerciements vont également à l’ensemble des membres du jury, merci beaucoup aux
Professeurs: Fabrice BOLAERS et François GUILLET d’avoir accepté de participer à mon jury.

3
Résumé
La production industrielle est actuellement déterminée par la concurrence mondiale et la nécessité
d’adapter rapidement la production aux demandes du marché en évolution constante. Ces exigences
ne peuvent être satisfaites que par des avancées radicales dans les technologies de fabrication
actuelles. L’industrie 4.0 est une approche intéressante basée sur l’intégration des processus
d’entreprise et de fabrication. L’objectif de cette thèse est de développer une méthodologie de la
maintenance 4.0 pour briser les compromis des anciennes stratégies en permettant aux entreprises
de maximiser la vie utile de leurs équipements de production tout en évitant les temps d’arrêt
imprévus, par combinaison de l’analyse vibratoire et la méthode de reconnaissance de formes pour
détecter, et suivre la dégradation d’un défaut. Deux méthodologies sont proposées, IRT-OPTICS
(Improved Real-Time Ordering Points to Identify the Clustering Structure) et AOC-OPTICS (Automatic
Online Classification monitoring based on OPTICS), basées sur la méthode de reconnaissance de
formes non supervisée. Ces méthodes devraient aboutir à une surveillance autonome. Elles visent à
déceler les dysfonctionnements des machines tournantes et de suivre l’évolution de ce
dysfonctionnement. Cette démarche commence par l’extraction de trois types d’indicateurs (scalaires,
temps-fréquence, temps-échelle), suivie par une réduction de dimension dans un espace visuel,
représentant la présence de défauts dans le roulement. L’étape suivante consiste à suivre l’évolution
de la dégradation en utilisant cinq paramètres : Davies-Bouldin index, Calinski-index, le saut du centre
de la classe, la densité, le contour.
Mots-clefs : L’industrie 4.0, l’analyse vibratoire, reconnaissance de formes, IRT-OPTICS, AOC-
OPTICS

Abstract
Industrial production is currently determined by the global competition and the need to adapt the
production quickly to changing market demands. These requirements can only be met by radical
advancements in the current manufacturing technologies. Industry 4.0 is an interesting approach
based on the integration of business and manufacturing processes. The objective of this thesis is to
develop a methodology of maintenance 4.0 to break the trade-offs of old strategies by allowing
companies to maximize the useful life of their production equipment while avoiding unplanned
downtime, by combining vibration analysis and pattern recognition methods to detect and track the
degradation of a defect. Two methodologies proposed IRT-OPTICS (Improved Real-Time Ordering
Points To Identify the Clustering Structure) and AOC-OPTICS (Automatic Online Classification
monitoring based on OPTICS), based on the unsupervised pattern recognition method. These methods
should lead to autonomous surveillance. They aim to detect the malfunctions of rotating machines and
to monitor the evolution of this malfunction. This starts with the extraction of three types of indicators
(scalar, time-frequency, time-scale), followed by a dimensional reduction in a visual space,
representing the presence of defects in the bearing. The next step is to follow the evolution of the
degradation using five parameters: Davies-Bouldin index, Calinski-index, jump from the centre of the
class, density, contour.
Keywords: Industry 4.0, vibration analysis, pattern recognition, IRT-OPTICS, AOC-OPTICS

4
Notations
Vca Vitesse tangentielle
Vi Vitesse de la bague intérieure
V0 Vitesse de la bague extérieure
Fca Fréquence de la cage.
α Angle de contact
D Diamètre du cercle primitif
d Diamètre de l’élément roulant
D0 Diamètre de la bague externe
Di Diamètre de la bague interne
Z Nombre de billes
d Diamètre de la bille
Fbpfi Fréquence de défaut sur bague interne
Fbpfo Fréquence de défaut sur bague externe
Fro Fréquence de rotation des éléments roulants
fr Fréquence de rotation de l’arbre
xRMS Valeur efficace
xi . Signal vibratoire
N Longueur du signal vibratoire
xcc Facteur crête à crête
xc Facteur crête
FI Facteur d’impulsion
x̅ Moyenne des données
x̂ (t) Transformée de Hilbert
X(f) Transformée de Fourier
t Variable de temps
f Variable de fréquence
xrmsf Valeur efficace fréquentielle
xfrmsb Valeur efficace fréquentielle pondérée
xfc Centre de fréquence
xfstdb Ecart type pondéré des fréquences
frms Valeur efficace du spectre de puissance du signal
Pw Puissance d’enveloppe
SPRI Pic de spectre de la bague intérieure
SPRO Pic de spectre de la bague extérieure
s(k) Spectre du signal
K Nombre de lignes spectrales
fk Fréquence de la 𝑘 é𝑚𝑒 ligne
H Nombre d’harmonique
c(τ) Cepstre
(|S(f)|2 ) Puissance d’amplitude
Sx Transformation de Fourier fenêtrée
h(t) Segment du signal
τ Indice de positionnement temporel de fenêtre
Wx Transformation de Wigner-Ville
5
ψ(t) Ondelette mère
C(a, b) Transformée en ondelettes continue
Wφ (j0 , k) Ondelettes enfant
xWRMS Valeur efficace des fréquences
xPCWT Valeur moyenne des amplitudes du spectre d’enveloppe
R xx(t ; τ) Cyclostationnarité
IMF Fonction Mode intrinsèque
r(t) Tendance moyenne
RF Relief
X2 Khi carré
DI Indice de Dunn
GV1 Indice de Calisnki-Harabasz
GV2 Indice Davies-Bouldin
GV3 Distance
GV4 Contour
GV5 Distance entre classes
Intra Critère intra-classes
Inter Critère inter-classes
Ik Extraction des indicateurs
X knorm Indicateurs normalisés
Yknorm Indicateurs réduits
C1 Classe 1 (sain)
C2 Classe 2 (défaut)
Bf. Base finale de la classe C2
A Amplitude
µ Facteur d’amortissement
b(t) Bruit du signal
Ra Rugosité arithmétique
Rt Rugosité totale

6
SOMMAIRE
INTRODUCTION GENERALE .................................................................................................................. 10

CHAPITRE I Etat de l’art sur les différentes méthodes de diagnostic de défaut des roulements......... 14
Introduction........................................................................................................................................... 15
Les roulements .......................................................................................................................... 15
La technologie ........................................................................................................................... 15
Roulements à rouleaux...................................................................................................... 15
Roulements à aiguilles ....................................................................................................... 16
Roulements à billes ........................................................................................................... 16
Les défauts de roulements ........................................................................................................ 17
Signatures de défaut ......................................................................................................... 18
Méthodes de détection et du suivi de défauts ................................................................. 21
Surveillance par analyse vibratoire ................................................................................... 21
Evolution de la maintenance industrielle .......................................................................... 22
L’analyse vibratoire ................................................................................................................... 23
Conclusion ............................................................................................................................................. 37

CHAPITRE II Les méthodes de reconnaissance de formes pour la surveillance des défauts des
composants mécaniques. ...................................................................................................................... 38
Introduction........................................................................................................................................... 39
Généralités sur les méthodes de Reconnaissance de Formes (RdF) ......................................... 39
Les différentes approches de reconnaissance de formes ................................................. 40
La méthode de reconnaissance de formes des données dynamiques.............................. 42
Les différents types de reconnaissance de formes dynamique ........................................ 43
Dynamique des classes ...................................................................................................... 45
Les méthodes de RdF pour la surveillance des défauts de roulements .................................... 46
Acquisition ......................................................................................................................... 46
Extraction des indicateurs ................................................................................................. 47
Normalisation des données ............................................................................................... 47
Sélection des indicateurs ................................................................................................... 47
Réduction de dimension .................................................................................................... 50
Classification ...................................................................................................................... 52
Conclusion ............................................................................................................................................. 66

7
CHAPITRE III Contribution à la mise en œuvre de méthodes de surveillance des roulements par une
classification dynamique basée sur l’algorithme OPTICS. ..................................................................... 67
Introduction........................................................................................................................................... 68
Classification dynamique pour le diagnostic de défaut de roulement ..................................... 68
Méthodes non supervisées ............................................................................................... 69
Méthodes supervisées....................................................................................................... 71
Étude des méthodes de classification supervisées et non supervisées [237] ................... 74
Contribution à la methode de surveillance en ligne par la classification dynamique :
adaptation de la méthode OPTICS .................................................................................................... 74
Architecture de la méthode de reconnaissance de formes développée .................................. 76
Première contribution: méthode IRT-OPTICS ........................................................................... 77
Les indicateurs ................................................................................................................... 79
Normalisation .................................................................................................................... 79
Réduction de dimension .................................................................................................... 79
Les paramètres de suivi ..................................................................................................... 80
Deuxième contribution: méthode AOC-OPTICS ........................................................................ 80
Architecture globale .......................................................................................................... 80
Phase 1: Initialisation......................................................................................................... 81
Phase 2: Détection............................................................................................................. 83
Phase 3 : Suivi .................................................................................................................... 83
Résumé des deux méthodologies IRT-OPTICS et AOC-OPTICS.................................................. 84
Conclusion ............................................................................................................................................. 85

CHAPITRE IV VALIDATIONS NUMERIQUE ET EXPERIMENTALE............................................................................. 86


Introduction ........................................................................................................................................... 87
1. Investigation analytique ............................................................................................................. 87
Modèle analytique des défauts.......................................................................................... 87
Validation de la méthodologie IRT-OPTICS ........................................................................ 88
Validation de la méthodologie AOC-OPTICS ..................................................................... 92
Résumé de l’investigation numérique pour IRT-OPTICS et AOC-OPTICS .......................... 99
Investigation expérimentale...................................................................................................... 99
Bancs d’essais .................................................................................................................... 99
Validation expérimentale de la méthodologie IRT-OPTICS ............................................. 101
Validation expérimentale de la méthodologie AOC-OPTICS ........................................... 105
Comparaison des deux méthodologies ................................................................................... 109
IRT-OPTICS ....................................................................................................................... 109
Limites de IRT-OPTICS...................................................................................................... 109

8
AOC-OPTICS ..................................................................................................................... 110
CONCLUSION ........................................................................................................................................... 111

CONCLUSION GENERALE ...................................................................................................................... 112

BIBLIOGRAPHIE .................................................................................................................................... 116


Table des figures.................................................................................................................................. 131
Liste des tableaux ................................................................................................................................ 134
Liste des algorithmes ........................................................................................................................... 135

9
INTRODUCTION GENERALE

10
L’Industrie 4.0 ou quatrième révolution industrielle attise de nombreuses curiosités dans les
communautés universitaires et industrielles. Ce concept est apparu pour la première fois dans
l’exposition de Hanovre en Allemagne en 2011. Il a été introduit par le ministère fédéral de l’éducation
et de la recherche. Si l’on essayait de le résumer en une phrase, on pourrait dire qu’il englobe tous les
développements technologiques et les changements organisationnels que cela a apporté au monde
industriel depuis le tournant du millénaire, en particulier avec l’avènement d’Internet et plus
généralement le développement du monde dit numérique.

La maintenance prédictive pour l’industrie 4.0 est une méthode pour prévenir la défaillance
des équipements en analysant les données de production, identifier les modes de fonctionnement de
la machine et prévoir les problèmes avant leur apparition. Le principal avantage de la maintenance
prédictive est de minimiser la maintenance imprévue et curative. En effet une efficacité accrue en
réduisant la maintenance inutile prolonge la durée de vie des équipements. La capacité à fournir des
services digitaux et numériques aux clients présente une opportunité de bénéfices et offre un nouveau
vecteur de croissance pour les entreprises. Elle améliore la satisfaction du client en envoyant des
alertes automatiques quand une pièce défaillante doit être remplacée.

Dans le cadre de la surveillance des machines tournantes, les roulements jouent un rôle central
dans l’industrie. Ils sont capables de guider, positionner et supporter les forces et les mouvements.
Dans l’initiative "Industrie 4.0", grâce à la mesure précise des données provenant de la surveillance de
l’état de fonctionnement on peut se faire une idée virtuelle précise sur l’état d’une machine d’après
son processus et son état de production.

La surveillance des machines tournantes s’appuie depuis des décennies sur l’analyse
vibratoire. L’analyse des vibrations vise à détecter les éventuels dysfonctionnements et à suivre leurs
évolutions afin de planifier une intervention mécanique. Le dysfonctionnement causé par un défaut
apparaît sous la forme d’une signature dans le signal de vibration. Dans ce contexte, le traitement du
signal est une approche très utilisée dans le diagnostic des défauts, parce qu’il détermine directement
l’état du système. Différentes techniques avancées de traitement du signal ont été proposées au cours
des dernières années et sont venues s’ajouter aux techniques plus conventionnelles. Comme chaque
technique a une base théorique différente, les résultats obtenus sont aussi généralement différents.
Certaines techniques peuvent être plus adaptées que d’autres pour un système ou un composant
spécifique en fonction des conditions environnementales. En conséquent il est essentiel de choisir les
techniques les plus efficaces pour la situation testée afin d’obtenir un diagnostic fiable.

Un diagnostic de défaillances d’un système industriel réalisé avec efficacité et permettant de


détecter précocement les dégradations améliore la productivité. C’est une partie intégrante de la
fonction de maintenance. Le diagnostic peut être abordé selon deux approches principales avec ou
sans connaissance préalable. La première approche est basée sur la modélisation des systèmes tandis
que la seconde repose sur les principes de l’intelligence artificielle. Les méthodes sans connaissance
préalable présentent plusieurs avantages, en particulier le fait qu’il n’est pas nécessaire d’utiliser le
modèle du système à diagnostiquer. Cette catégorie comprend les méthodes basées sur la
reconnaissance de formes (RdF), les systèmes experts, les réseaux de neurones.

L’intérêt de cette thèse est le diagnostic par reconnaissance de formes. La reconnaissance de


formes consiste à évaluer la ressemblance entre le vecteur des phénomènes observés et le vecteur
des phénomènes de référence. Elle regroupe l’ensemble des méthodes permettant de classer
11
automatiquement les objets. En termes de diagnostic, une classe correspond à un mode de
fonctionnement sain ou défectueux et un objet correspond à une observation (signal par exemple)
caractérisée par un ensemble de paramètres. Les méthodes basées sur la reconnaissance de formes
sont de plus en plus utilisées dans le diagnostic de défauts des machines tournantes. Ces méthodes
sont utilisées dans la plupart des cas des formes statiques et ne prennent pas en compte l’évolution
de l’état de fonctionnement de la machine. [1] a développé une méthode de classification dynamique
basée sur l’algorithme DBSCAN. Compte tenu de la difficulté de son exploitation dans le domaine
industriel, la dimension temporelle a été intégrée dans l’algorithme pour résoudre son aspect statique.
La réalisation de l’algorithme présenté permet de voir clairement l’évolution des défauts où chaque
classe formée représente un nouvel état de dégradation. La problématique rencontrée vient du fait
que les classes de l’ensemble de données ne peuvent pas être caractérisées par une seule valeur de
densité, alors que le nombre de valeurs possibles pour le paramètre de densité est infini. Une façon
de corriger ce problème consiste à définir un algorithme dans lequel toutes les valeurs possibles pour
ce paramètre de densité sont prises en considération. L’algorithme OPTICS est une extension de
l’algorithme de classification spatial basé sur la densité (DBSCAN). Pour cette forme d’algorithme, les
objets se trouvant dans des régions denses sont affectés en tant que membres de classes. Les bruits
sont des objets situés dans des régions moins denses, situées séparément des membres des classes.
[2] a proposé une méthode de classification dynamique basée sur l’algorithme OPTICS (RT-OPTICS :
Real Time OPTICS) en utilisant deux indicateurs temporels : le kurtosis et la valeur RMS.

Nous proposons dans ce travail une généralisation de la méthode RT-OPTICS en utilisant


plusieurs indicateurs de défauts et méthodes de réduction de dimension afin d’optimiser et donc de
fiabiliser la détection et le suivi en temps réel des défauts de roulements, notamment les défauts de
bagues extérieures. L’algorithme proposé est organisé en trois boucles de calcul : initialisation,
détection, suivi. La phase d’initialisation concerne l’initialisation de la matrice d’indicateurs de défauts
ainsi que la constitution d’une classe dite « classe saine ». La phase de détection est une boucle de
calcul qui consiste premièrement à constituer une matrice d’indicateurs et à la normaliser à partir des
signaux enregistrés, à l’instant t, deuxièmement à réduire la dimension de cette matrice par projection
sur une nouvelle dimension et enfin à appliquer la méthode de classification OPTICS pour détecter
l’apparition d’une nouvelle classe dite « classe de défauts ». La phase de suivi consiste à projeter la
matrice d’indicateurs de défauts dans la base finale et de suivre dans le temps l’évolution de cette
classe dans la même base. Cette phase de suivi est destinée à prédire la défaillance ou à prévoir le
remplacement du composant défectueux.

Le premier chapitre est un chapitre introductif présentant une synthèse générale sur les
différents types de roulements, leurs principaux défauts ainsi qu’une étude bibliographique sur les
différentes méthodes et techniques d’analyse des vibrations utilisées dans le cadre de diagnostic de
défauts des roulements. Ce chapitre est composé de deux parties. La première partie s’intéresse à la
définition du roulement et à ses modes de dégradation. La deuxième partie comporte les différentes
méthodes de détection et du suivi des défauts en s’appuyant sur les données vibratoires. Une étude a
été effectuée sur les diverses méthodes et techniques d’analyse des vibrations, cette étude a pour but
de mettre en évidence les avantages et les inconvénients des différentes techniques utilisées dans
l’analyse vibratoire en présence de différentes variables telles que la variation de charge ou la vitesse
de rotation, ce qui explique l’intérêt d’utiliser des outils tels que les méthodes de reconnaissance de
formes.

12
Le deuxième chapitre explique les outils nécessaires au développement du processus de
surveillance. Cela passe par l’introduction de la structure générale des méthodes de reconnaissance
de formes, la mise en évidence des différences entre les différentes méthodes statiques et
dynamiques, aussi les méthodes de classification supervisée, non supervisée et semi- supervisée. Par
conséquent nous soulignons la nécessité de définir un indice de classification capable de classer les
données et de les contrôler en temps réel, ce qui rend la classification dynamique. Le classifieur
dynamique pour réaliser son objectif, doit disposer de règles d’apprentissage qui lui permettent de
prendre en compte de nouvelles informations ainsi que de considérer l’évolution des connaissances et
des phénomènes dynamiques associés. Nous présentons également les outils pour la mise en place
d’une classification dynamique : méthodes d’extraction d’indicateurs, méthodes de réduction de
dimensions, et méthodes de classification. De plus, nous montrons comment les principes de la RdF
peuvent être mis en œuvre pour résoudre le problème du diagnostic d’un système.

Le troisième chapitre repose sur l’algorithme OPTICS pour mettre en œuvre deux méthodologies
efficaces de diagnostic et de suivi de défauts par classification dynamique. Après le choix de
l’algorithme OPTICS et une discussion de ses avantages, l’étape suivante consiste à détailler
l’architecture de deux algorithmes. Ces algorithmes s’appuient sur trois phases, à savoir :
l’initialisation, la détection et le suivi. Les trois phases des algorithmes combinent des méthodes
d’extraction d’indicateurs dans les domaines: temps, fréquence et temps-fréquence. Ensuite ils
procèdent à la réduction de dimensions et sélection des indicateurs par les méthodes linéaires ACP,
non linéaires ACPK et t-SNE puis le filtrage avec Relief. La deuxième phase utilise la classification
intelligente optimisée et automatisée par la méthode OPTICS. Enfin on explique pour la troisième
phase le suivi par des paramètres géométriques qui seront introduits et discutés pour chacune de ces
étapes.
Enfin dans le quatrième chapitre, les deux méthodologies proposées dans le chapitre 3 sont
validées par un traitement des signaux d’un modèle analytique avant d’appliquer sur des signaux réels
émis par des roulements ayant différents états et dans différentes conditions de fonctionnement
(sévérité des défauts, vitesses, charges) pour contrôler les paramètres d’influence et montrer
l’efficacité des méthodes proposées. En dernier lieu, dans ce chapitre est également présenté d’une
part le banc expérimental, la structure des données collectées, les étapes d’application de la méthode
et son paramétrage et d'autre part, les résultats obtenus en fonction des différents paramètres de
réglage de vitesses de rotation et charges appliquées. Une étude comparative entre les résultats
obtenus par les deux méthodologies de classification a permis de différencier l’évolution des
différentes classes en fonction de ces paramètres.

Nous terminerons par une conclusion générale sur l’ensemble de cette étude et nous proposons des
perspectives de travail.

13
CHAPITRE I
ETAT DE L’ART SUR LES DIFFERENTES METHODES DE DIAGNOSTIC DE DEFAUT
DES ROULEMENTS.

14
INTRODUCTION
L’identification des défauts dans une machine, la réduction des pannes et des temps d’arrêt imprévus
sont de plus en plus exigés par les technologies de surveillance d’état. L’analyse vibratoire est
considérée par la communauté scientifique comme l’une des méthodes les plus efficaces pour
identifier et diagnostiquer les défauts mécaniques dans les machines. Elle utilise l’information induite
par les signatures vibratoires par le biais d’indicateurs de l’état de la machine. L’analyse vibratoire est
utilisée pour détecter les défauts naissants et sévères dans les composants de machines, comme les
roulements, les engrenages, les arbres, etc. Dans ce chapitre, nous allons présenter les roulements,
leurs modes de défaillances, ainsi que les différentes techniques pour détecter et effectuer le suivi de
défauts basées sur l’analyse vibratoire.

Les roulements
Le roulement est un organe qui se trouve entre les paliers et les arbres des systèmes mécaniques en
rotation. Les principales fonctions des roulements sont [3]:

• Réduire la friction entre les pièces mobiles dans la machine.


• Supporter les pièces tournantes d’une machine.
• Soutenir une charge radiale, perpendiculaire à l’axe de rotation.
• Soutenir une charge axiale, dont la direction est la même que l’axe de rotation du roulement.

Les roulements sont généralement constitués de deux parties principales, appelées la bague intérieure
et la bague extérieure. Entre eux se trouve une cage qui sert à séparer les éléments roulants (rouleaux,
aiguille, bille, etc.) à des distances spécifiques. La cage a pour objectif de garder en place les billes à
l’intérieure du roulement, et les empêche de tomber lors du mouvement, avec une possibilité de
rotation. Lorsqu’un roulement est monté dans un assemblage, la bague extérieure s’adapte sur le
palier, tandis que la bague intérieure se situe autour de l’arbre [4].

La technologie
Il existe plusieurs types de roulements : roulements à rouleaux, roulements à aiguilles et roulements
à billes [4]. Chaque type de roulement possède son propre domaine d’application. Pour cela il faut
connaître les applications et les limites de chaque type de roulement ainsi que les principes de
fonctionnement fondamentaux afin de pouvoir sélectionner le roulement approprié.

Roulements à rouleaux

Les roulements à rouleaux utilisent des éléments roulants cylindriques [5], [6], coniques [7]. La figure
1.1 représente le type de roulement à rouleaux coniques.. La forme permet de réduire le frottement
en rotation et de supporter des fortes charges radiales et axiales à de faibles vitesses. La capacité de
charge axiale du roulement peut être déterminée par l’angle de contact entre le roulement et l’arbre,
qui correspond à l’angle de la surface extérieure du chemin de roulement [7][8].

Ces types de roulements sont utilisés dans des applications à usage quotidien. Ils peuvent également
être trouvés dans des produits de l’industrie automobile comme les boîtes de vitesses, les moteurs et
les réducteurs mécanique, les roues de voiture, les roues de wagons, le matériel agricole, etc.

15
Figure 1. 1 Roulement à rouleaux coniques

Roulements à aiguilles

Les roulements à aiguilles sont des roulements à rouleaux cylindriques avec un diamètre faible par
rapport à la longueur du rouleau. La figure 1.2 correspond au roulement à aiguilles. Dans ce type de
roulement le rapport longueur sur diamètre d’un roulement à aiguilles est supérieur à quatre. Par
rapport à leur taille, ils ont une grande capacité de charge, en particulier à basse vitesse. Ils
conviennent également aux applications à grande vitesse dans la mesure où ils peuvent être usinés
avec une grande précision en raison de leur structure. Leur conception permet une résistance aux
oscillations, et un fonctionnement dans des conditions sévères. Ce type de roulement offre une grande
rigidité et des forces d’inerties faibles qui facilitent les réductions de taille et de poids dans les
machines [9].

Figure 1. 2 Roulement à aiguilles


Les roulements à aiguilles sont utilisés dans de nombreuses applications telles que la production de
pétrole, la production d’électricité, la transmission d’énergie, le traitement du ciment, le concassage
d’agrégats et le recyclage des métaux, les moteurs électriques, les éoliennes et les boîtes de vitesses,
etc.[10].

Roulements à billes

Les roulements à billes sont composés d’éléments roulants sphériques. Ce type de roulement est
présenté dans la figure 1.3 il est utilisé pour des applications à faible charge, et généralement aux
vitesses les plus élevées. Dans le cas des billes, le contact avec le chemin de roulement se fait à des
points précis, alors que les surfaces de contact des rouleaux sont légèrement plus grandes et linéaires.
Ces particularités rendent les roulements à billes plus adaptés à des applications impliquant de plus
grandes vitesses, étant donné que les zones de contact plus petites entraînent une friction de
roulement plus faible. Les roulements à billes sont constitués de quatre composants : la bague
extérieure, la bague intérieure, un dispositif de cage et les billes [11].

16
 Les bagues extérieure et intérieure soutiennent le mouvement de rotation.
 Les billes réduisent le frottement de ce mouvement de rotation.
 Le dispositif de cage maintient les billes en place.

Les roulements à billes sont présents dans de nombreux produits que nous utilisons au quotidien les
appareils électroménagers, les machines à laver, les ventilateurs, dans les secteurs automobile,
aéronautique.[12].

Figure 1. 3 Roulement à billes

Les défauts de roulements


Les machines tournantes sont complexes et comportent de nombreux composants susceptibles de
tomber en panne. La majorité des machines tournantes disposent de roulements. En raison de la
nécessité et de la contribution vitale à la plupart des machines tournantes, les exigences sur les
roulements sont devenues plus strictes chaque jour. Une analyse doit être effectuée pour identifier les
défauts des roulements avant une panne qui peut s’avérer catastrophique sur les plans économique
et humain. Suivant la norme ISO 15243 :2017 [13] le défaut est défini comme tout changement de
fonctionnement initial dans une pièce ou dans un composant de machine, qui rend la machine
incapable d’exécuter les tâches qui lui sont assignées d’une manière satisfaisante, ou bien la fin de la
disponibilité du composant et sa fonction prévue. Un roulement peut également avoir une défaillance
avant le temps prévu. La norme ISO 15243 :2017 [13] décrit les principaux modes de défaillance et
leurs causes.

Ces modes de défaillance sont caractérisés comme suit [14] :

 Surchauffe liée à la rotation : le roulement se décolore, les éléments roulants et la cage se


déforment, fusionnent et deviennent plus souples au fur et à mesure que les détériorations
s’aggravent.
 Usure : se présente quand des corps extérieurs pénètrent dans le mécanisme de roulement.
 Corrosion : apparaît en cas de présence importante d’eau ou d’agents chimiques à l’intérieur
du roulement.
 Érosion électrique : se produit quand le roulement est traversé par un courant électrique.
 Fracture et fissuration : les pièces de petite taille se détériorent si le roulement est soumis à
une charge trop élevée, ou si la taille et la capacité du roulement sont insuffisantes pour leur
application.
 Écaillage : survient quand de petites particules de matériaux de roulement se séparent du
roulement, produisant des surfaces à la structure brute et rude.

17
 Eraflures : augmentation du nombre de petits grippages, provoquée par un fonctionnement
dans des conditions d’utilisation sévère ou de lubrification inadéquate.
 Fissures : causées par des efforts excessifs de tension, des charges ou par des chocs.
 Impact de la vibration : les moteurs sans fixation de l’arbre du rotor peuvent provoquer des
vibrations au niveau du palier, ce qui peut abîmer les roulements.
 Insuffisance de la charge de roulement : Les roulements utilisés ne doivent jamais avoir une
charge insuffisante pour fonctionner correctement.

a b c d
Figure 1. 4 diffèrent types de défaillance du roulement[15]

Différents types de défaillance du roulement représentés dans la figure 1.4. (a) représente l’écaillage
le long du chemin de roulement, (b) montre l’usure de contact du chemin de roulement, (c) montre un
phénomène de corrosion électrique en forme de ceinture accompagné de piqûres sur la piste du
roulement, (d) représente des fissures dans le sens axial sur la surface du chemin de roulement.

Une défaillance prématurée des roulements dans une application appropriée est généralement
attribuée à une ou plusieurs des causes évoquées ci-dessus, qui peuvent et doivent être surveillées et
corrigées avant de se produire, afin d’éviter de futures défaillances de roulements et des coûts
supplémentaires [10].

Signatures de défaut

A la présence d’un défaut sur un élément du roulement, le passage de l’élément roulant sur le défaut
produit une force impulsive qui fait vibrer l’ensemble. La réponse impulsionnelle oscille à une
fréquence propre du système qui s’évanouit rapidement à cause de l’amortissement du système. A
chaque type de défauts, on peut associer une fréquence caractéristique ou fréquence de défauts qui
peut être déterminée en fonction de la géométrie du roulement, du nombre de billes, des vitesses de
rotation des bagues intérieure et extérieure. Des fréquences différentes sont généralement obtenues
pour les défauts sur bague extérieure, bague intérieure, cage, ou sur l’un des éléments roulants. Ces
fréquences théoriques sont obtenues à partir des relations suivantes [16], et d’après la figure 1.5 qui
représente la géométrie du roulement.

A. Fréquence de la cage

La vitesse d’un élément roulant due à la rotation autour de son axe est égale et opposée au point de
contact avec les bagues intérieure et extérieure. Par conséquent, les axes des éléments roulants et la
cage contenant les éléments roulants doivent se déplacer à une vitesse égale à la moyenne des vitesses
des bagues intérieure et extérieure pour maintenir les bagues sans glissement (Eq.1.1).

18
V0 + Vi
Vca = (1.1)
2

Vca est la vitesse tangentielle au cercle primitif. Vi et V0 sont les vitesses respectivement de la bague
intérieure et extérieure. Fca est la fréquence de la cage et s’écrit :
D0 fo + Di fi (1.2)
Fca =
D

fo , fi sont les fréquences de rotation des bagues externe et interne respectivement.

La relation entre les diamètres des bagues avec le diamètre du cercle primitif D, le diamètre de
l’élément roulant d, et l’angle de contact α, sont les suivantes :

D0 = D + dcos(α) (1.3)

Di = D − dcos(α) (1.4)

Figure 1. 5 Géométrie d’un roulement : angle de contact α, diamètre du cercle primitif D, diamètre de
l’élément roulant d, 𝐃𝐢 bague interne, 𝐃𝟎 bague externe

D’après les équations (1-3), (1-4) et (1-2), la fréquence de rotation de la cage peut être calculée en
considérant le diamètre des bagues, l’angle de contact et le diamètre de l’élément roulant comme suit:
d d
(1+D cos(α))fo +(1−D cos(α))fi (1.5)
Fca =
2

B. Fréquence de passage de la balle sur la bague extérieure / intérieure


Les bagues intérieure et extérieure d’un roulement sont attachées à un autre composant.
Habituellement, la bague intérieure est fixée à l’arbre et a donc la même vitesse de rotation que l’arbre
tandis que la bague extérieure est fixe. Les fréquences des défauts de bagues internes Fbpfi et externes
Fbpfo sont appelées fréquences de passage de billes. Elles sont calculées avec les équations suivantes
[17] :
Z(fi −fo ) d (1.6)
Fbpfi = Z(Fca − fi ) = (1 + cos(α))
2 D

Z(fi −f0 ) d (1.7)


Fbpfo = Z(Fca − fo ) = (1 − cos(α))
2 D

Où Z est le nombre de billes.

19
C. Fréquence de rotation de la bille
La fréquence de défaut de bille est généralement appelée fréquence de rotation de bille. La fréquence
de rotation de la bille est la fréquence à laquelle la bille entre en contact avec l’une des bagues.
L’équation de la fréquence de rotation des éléments roulants Fro s’écrit :

Fro πd = (fi − Fca )π(D − dcos(α)) = (fo − Fca )π(D + dcos(α)) (1.8)

1 D D (1.9)
Fro = (fi − fo ) ((1 − cos(α))2 )
2 d d

Il convient de noter que les équations (1-5), jusqu’à (1-9) ne tiennent pas compte du glissement des
éléments tournants. Dans l’hypothèse d’une bague extérieure fixe, sans glissement de la bague
intérieure et des éléments roulements, les équations de (1-5), jusqu’à (1-9) deviennent :
Z d (1.10)
Fbpfi = fr (1 + cos(α))
2 D

Z d (1.11)
Fbpfo = fr (1 − cos(α))
2 D

1 D d (1.12)
Fro = f ((1 − cos(α))2 )
2 r d D

1 d (1.13)
Fca = (1 − cos(α))
2 D

Où fr est la fréquence de rotation de l’arbre.

Figure 1. 6 Signaux de vibration sur le roulement dans des conditions normales, défaut de la bague
intérieure, défaut de la bague extérieure et défaut de la bille[18]

La figure 1.6 montre des exemples de signaux vibratoire de roulements pour les quatre conditions de
roulements, conditions normales, défaut de la bague intérieure, défaut de la bague extérieure et
défaut de la bille.

Cependant, comme l’a montré [17], en réalité, il y a toujours un certain glissement et ces équations
donnent une estimation théorique qui varierait de 1 à 2% par rapport aux valeurs réelles. Les

20
fréquences données par les équations (1.10) jusqu’à (1.13) ne seront présentes dans un spectre de
vibration que lorsque les roulements sont défectueux ou, au moins, lorsque leurs composants sont
soumis à des contraintes et des déformations pouvant induire un défaut.

Méthodes de détection et du suivi de défauts

Il existe un grand nombre de méthodes de détection des défauts de roulements. Nous pouvons citer,
de manière non exhaustive [19][20] :

 La thermographie infrarouge. L’augmentation de la température donne la possibilité d’utiliser


l’imagerie thermique pour détecter et localiser le défaut. Il permet également une
visualisation spatiale de la propagation de la chaleur dans les zones surveillées.
 La détection par mesure de déplacement laser. La vélocimétrie laser Doppler est présentée
comme une méthode de mesure du profil de surface et de détection des fissures de surface
dans les billes de roulement.
 La détection des bruits (acoustique). L’émission acoustique est une technique émergente pour
surveiller l’état de roulement.
 L’analyse des lubrifiants. Elle consiste à analyser des propriétés des lubrifiants, des polluants
en suspension et des débris de corrosion.
 La surveillance vibratoire des roulements. Parmi toutes les méthodes la surveillance vibratoire
est la plus pertinente. Cette méthode est devenue très célèbre de nos jours, à cause de son
efficacité pour détecter et prévenir les dépannages dans les équipements de la machine
tournante, [21][22].

a b c d
Figure 1. 7 Différentes méthodes de détection et du suivi de défauts du roulement, (a) Inspection par
thermographie infrarouge du roulement à billes [23], (b) Systèmes de mesure laser pour l'industrie
[24],(c) Inspection ultrasonique défaillance dans les roulements [25], (d) Analyse vibratoire des machines
tournantes [26]

Surveillance par analyse vibratoire

La surveillance vibratoire permet de connaître l’état des machines et son évolution. Ceci peut être
déterminé en choisissant des indicateurs mesurant la détérioration par mesures régulières ou
continues. Les valeurs sont mesurées pendant le fonctionnement de la machine. Les données obtenues
peuvent ensuite être analysées pour donner un préavis de défaillance. Cette activité est appelée
surveillance de l’état de la machine. La plupart des défauts rencontrés dans les machines tournantes
donnent lieu à un modèle de vibration distinct (techniques d’analyse des signatures vibratoires). La
surveillance vibratoire a la capacité d’enregistrer et d’identifier les "signatures" vibratoires, ce qui rend
la technique si puissante pour la surveillance des machines tournantes. L’analyse des vibrations est
normalement appliquée en utilisant des capteurs pour mesurer l’accélération, la vitesse ou le

21
déplacement. Le choix dépend en grande partie des fréquences analysées. L’instrumentation associée
consiste généralement en des capteurs fixés à un endroit spécifique et dans une direction spécifique.
Généralement, le capteur le plus utilisé est l’accéléromètre.

Dans la surveillance vibratoire Il y a généralement trois activités principales [22][27]:

 La détection : La surveillance des vibrations est l’une des techniques les plus populaires pour
sa capacité à détecter les défauts depuis sa création avant qu’ils ne deviennent critiques et
dangereux.
 Le diagnostic : il utilise des outils plus sophistiqués sur le plan mathématique. Elle permet de
déterminer la partie de la machine qui est défectueuse après la détection d’une manifestation
irrégulière des vibrations relevées lors de la surveillance.
 Le suivi : le but est de surveiller le fonctionnement d’une machine en comparant les relevés
successifs de vibrations. Une progression de certains indicateurs par rapport aux valeurs de
référence constituant la signature alerte. La signature est généralement obtenue à la suite
d’une première mesure sur la machine neuve ou révisée.

Evolution de la maintenance industrielle

La production industrielle a beaucoup évolué depuis la révolution industrielle, mais les changements
les plus spectaculaires sont produits au cours des cinquante dernières années. Les changements ont
affecté la manière de réaliser la maintenance des usines industrielles [28]. Avant la deuxième guerre
mondiale, les machines étaient généralement grandes, robustes et relativement lentes à fonctionner,
avec des systèmes de contrôle et des instruments de base. Les demandes de production n'étaient pas
aussi immenses qu’aujourd’hui, de sorte que les temps d’arrêt n’étaient pas un problème aussi
critique. En cas d’arrêt, on s’en occupait, mais en général, ces machines étaient fiables. Dans certaines
usines plus anciennes, les machines fabriquées à cette époque sont encore aussi performantes
aujourd’hui que le jour où elles ont été fabriquées. La mise en œuvre des systèmes de maintenance se
fera à partir d’une plus grande intégration des systèmes techniques et commerciaux, avec une
utilisation plus intelligente des données collectées. Ils protègeront les utilisateurs contre les erreurs de
personnel, avec la perte inhérente de leur apprentissage, et permettront aux responsables de faire des
choix mieux informés.
Il est impossible de chercher des réponses à la question de la maintenance durable sans considérer la
technologie comme une partie intégrante du développement. Le développement de nouvelles
technologies et les exigences des utilisateurs finaux ont eu un impact significatif sur les opérations de
maintenance (machines et équipements) ainsi que sur la manière de planifier et de mettre en œuvre
les activités de maintenance. En ce qui concerne l’application des nouvelles technologies dans les
machines et les appareils que nous utilisons aujourd’hui, le terme le plus courant est celui de "machine
intelligente". Le terme "machine intelligente" implique une machine mieux connectée, plus flexible,
plus efficace et plus sûre. Elle peut rapidement répondre à de nouvelles demandes. La "machine
intelligente" se compose de trois éléments principaux : des composants physiques, des composants
intelligents et des composants de connectivité. Les composants intelligents sont directement
connectés aux services liés aux parties physiques, tandis que la connectivité permet d’échanger des
informations entre la machine et son environnement, et permet aux services d’exister en dehors de la
machine physique elle-même.

22
L’analyse vibratoire
L’analyse vibratoire fait appel à des techniques du traitement du signal plus ou moins avancées.
D’après la littérature on peut constater quatre domaines de représentation. Le tableau suivant résume
les techniques les plus utilisées et qui seront repris dans cette thèse.

Tableau 1. 1 Les différentes techniques d’analyse du signal

Domaine Techniques de traitement du signal


Temporel Analyse statistique
Fréquentiel Analyse spectrale Analyse d’enveloppe Analyse Cepstrale
Temps-fréquence Transformée de Fourier Wigner Ville
courte terme
Temps-échelle Transformation en Cyclostationnarité Décomposition en mode
ondelettes empirique
Analyse temporelle

Les méthodes temporelles sont basées sur l’analyse statistique du signal recueilli, elles s’appliquent à
des machines simples. Le développement de ces types d’indicateurs signifie qu’un défaut se développe
[27]. Ce type de méthode permet de détecter les défauts mais pas de localiser dans quels équipements.
Parmi les d’indicateurs existants dans la littérature on a choisi d’utiliser quelques indicateurs qui sont
mentionnés ci-dessous :
4.1.1.1. La valeur efficace (RMS)

La valeur efficace RMS (Eq.1.14) est la racine carrée de la quadratique du signal. Cet indicateur est à
utiliser pour surveiller l’état de la machine qui est en relation avec l’énergie de vibration et donc le
"potentiel de détérioration" de la vibration [29]. Cependant, il ne parvient pas à détecter les défauts à
haute fréquence, généralement causés par le stade précoce de l’usure des roulements. La plupart des
émetteurs de vibrations traditionnels ont des réponses en fréquences limitées (1 kHz maximum) et ne
peuvent pas distinguer les impacts des roulements à haute fréquence, qui ont une amplitude beaucoup
plus faible que la vibration à large bande.
1
1 N 2
xRMS = ( ∑i=1(xi2 )) (1.14)
N

Où N est la longueur du signal vibratoire xi .

4.1.1.2. Le facteur crête-à-crête

Le facteur crête-à-crête (Eq.1.15) est la différence entre les amplitudes maximale et minimale du
signal. Il s’agit d’une valeur utile pour déterminer le mouvement des composants, le déplacement qui
peut être critique pour des considérations de contrainte maximale ou de jeu mécanique [30].

xcc = max (xi ) - min (xi ) (1.15)

4.1.1.3. Facteur crête

Le facteur crête (Eq.1.16) calcule le rapport entre l’accélération maximale et la RMS. Par conséquent,
cette valeur augmente à mesure que l’amplitude des impacts à haute fréquence dans le palier
augmente par rapport à l’amplitude des vibrations globales à large bande. La valeur crête est une

23
excellente mesure de l’état du roulement : plus les défauts sont graves, plus l’impact est élevé et plus
la réponse est élevée. Cependant, pour utiliser ce paramètre, la signature vibratoire du roulement doit
être séparée des vibrations beaucoup plus fortes qui proviennent de la machine. Ces vibrations plus
fortes sont causées par un déséquilibre, un désalignement ou un relâchement. Le facteur crête définit
le rapport entre la valeur de crête d’un signal et la valeur RMS [31].

xcc
xc =x (1.16)
RMS

Le facteur crête à l’avantage de détecter les défauts avant la valeur efficace (RMS). Ceci provient du
fait que pour un roulement sans défaut, le rapport reste sensiblement constant et augmente
lorsqu’une dégradation apparaît alors que la valeur crête croit pendant que la valeur efficace reste à
peu près constante. Le facteur crête donne l’amplitude maximale utile dans toutes les décisions qui
concernent les phénomènes de courte durée et les chocs en sont un exemple.
4.1.1.4. Facteur d’impulsion

Utilisé pour la détection d’un défaut au début de la dégradation, les valeurs du facteur d’impulsion
deviennent des fonctions monotones décroissantes de la détérioration une fois que le défaut atteint
un maximum. Le facteur d’impulsion (Eq.1.17) est sensible aux défauts naissants. La sensibilité diminue
considérablement lorsqu’un défaut se développe dans une certaine mesure. Cet indicateur utilisé pour
caractériser l’impact existant dans les roulements peut bien refléter les singularités qui sont générées
par le contact entre un défaut et les éléments tournants [30].

Max(∣ x ∣)
FI =
1 N (1.17)
∑ ∣ xi ∣
N i=1
4.1.1.5. L’écart type

L’écart type (Eq.1.18) mesure la variation des valeurs des données par rapport à la moyenne, une
valeur élevée indique que les valeurs des données sont réparties sur une large plage de valeurs et vice
versa pour une valeur faible. L’écart-type peut être utilisé pour la détection précoce des défauts de
roulement [32].

N 1 (1.18)
1
𝜎= ∑ (xi − x̅)2
N i=1

Où x̅ est la moyenne des données, et N est la longueur du signal vibratoire xi .

4.1.1.6. Dissymétrie

La dissymétrie (Skewness) (Eq.1.19) est un indicateur d’ordre 3 mesurant l’énergie par rapport à un
niveau moyen. Les surfaces usinées ou rectifiées dans les roulements présentent une distribution
aléatoire des aspérités qui sont communément décrites avec la fonction de distribution normale. La
dissymétrie est l’une des mesures statistiques les plus couramment utilisées pour diagnostiquer les
défauts des roulements des éléments roulants. La dissymétrie est l’un des descripteurs de la forme de
la distribution d’amplitude des données de vibration collectées à partir d’un roulement, et présente
certains avantages par rapport à l’analyse traditionnelle de temps et de fréquence, tels que sa plus

24
faible sensibilité aux variations de charge et de vitesse. En traitant des signaux, [33] ont montré que le
skewness donnait de meilleurs résultats que le Kurtosis.

N
1 (xi − x̅) 3
Skewness = ∑ (1.19)
N (N − 1)σ3
i=1

4.1.1.7. Kurtosis

Le Kurtosis (Eq.1.20) est une mesure de la taille des extrémités de la distribution et il est utilisé comme
indicateur des pics principaux dans une base de données. Le Kurtosis utilise un moment d’ordre 4.

N
4
1 (xi − x̅) (1.20)
Kurtosis = ∑
N σ4
i=1

Le Kurtosis est largement utilisé pour détecter les défauts dans les machines tournantes. C’est un
indicateur représentant la nature impulsive d’un signal et permet la détection précoce d’un défaut de
roulement. D’après la littérature [34], trouver une valeur égale à 3 signifie que l’équipement
fonctionne normalement et si la valeur est supérieure à 3 cela signifie qu’il est défectueux. Cet
indicateur comme tous les indicateurs temporels donne une idée sur la santé globale de la machine
sans pour autant savoir beaucoup de choses sur l’historique de la machine. Le Kurtosis doit être utilisé
avec précaution car il est très sensible aux chocs [35], ce qui oblige à l’employer dans un
environnement peu complexe afin de ne pas commettre d’erreurs de diagnostic.

4.1.1.8. Thikat

Le THIKAT(Eq.1.21) est une alternative au Kurtosis. THIKAT est calculé à partir de différents paramètres
qui sont le RMS, le facteur crête-à-crête, le Facteur crête, et le Kurtosis. Le THIKAT est un indicateur
moins sensible que le Kurtosis, et a l’inconvénient de donner une alarme trop tard dans la dégradation.
Lorsque les dégradations augmentent de façon importante, le Thikat devient nul et il est impératif
d’arrêter la machine [36].

Log ((Kurtosis). ^ xc +xRMS / xRMS(S) .^ xc ) (1.21)

Où xRMS(S) la valeur efficace définie pour un roulement sain.

4.1.1.9. TALAF

TALAF (Eq.1.22) est un indicateur contrairement aux indicateurs classiques (RMS, Kurtosis) qui reflète
l’évolution de la dégradation du début jusqu’à sa fin. Sa valeur ne diminue pas en présence de plusieurs
défauts [36].

Log (Kurtosis + xRMS / xRMS(S) ) (1.22)

Où xRMS(S) la valeur efficace définie pour un roulement sain.

25
4.1.1.10. Les limites de l’analyse temporelle

Les indicateurs temporels montrent qu’ils ne sont pas efficaces à faible vitesse, mais peuvent interagir
dans les stades de dégradation avancée. Les indicateurs comme le Kurtosis et facteur crête détectent
les défauts au stade de dégradation très avancée [37]. Dans [38], il a démontré que le Kurtosis n’était
efficace qu’à des vitesses plus grandes que 100 révolutions par minute (RPM), et a comparé les
tendances des indicateurs statistiques notamment le Kurtosis de roulements sains et défectueux. [39]
compare l’émissions acoustique et l’analyse vibratoire à basses vitesses, à partir des signaux temporels
et des indicateurs statistiques à savoir le Kurtosis, le RMS, le Skewness, et le facteur crête d’un
roulement défectueux et d’un sain. Le domaine temporel ne convient pas pour un diagnostic efficace
des défauts, mais elle est bien meilleure lorsqu’elle est combinée avec d’autres approches, par
exemple, le réseau neuronal [40], la reconnaissance de formes et l’intelligence artificielle. [41] ont
réalisé le diagnostic des pannes de rouleaux porteurs auto-alignés dans différentes conditions, en
utilisant des mesures statistiques pour obtenir des fonctionnalités utiles, puis en les classant avec un
algorithme d’arbre de décision.
Analyse fréquentielle

On peut obtenir l’analyse fréquentielle classique à partir de la transformée de Fourier du signal


temporel. Il existe plusieurs techniques d’analyse particulière qui nous donne une bonne idée sur la
santé globale et l’état des roulements. L’analyse en fréquence est une méthode efficace pour le
traitement des signaux vibratoires [42]. La connaissance de Indicateurs fréquentiels permet de
localiser et d’identifier le genre de défauts dans les machines tournantes.

4.1.2.1. Analyse spectrale

L’analyse spectrale est basée sur la transformée de Fourier du signal vibratoire représentée dans la
figure 1.8. La méthode d’analyse spectrale donne beaucoup d’information pour réaliser un diagnostic
dans un stade précoce. Le transformée de Fourier est donc définie par l'équation suivante :


(1.23)
X(f) = ∫ x(t). e−j2πft dt
−∞

X(f) est la transformée de Fourier, t la variable de temps, f est la variable de fréquence.


La transformée de Fourier convertit le signal du domaine temporel en signal du domaine fréquentiel
[43].

On peut calculer des Indicateurs statistiques dans le domaine fréquentiel tels que: la valeur efficace
fréquentielle xrmsf [44][45], la valeur efficace fréquentielle pondérée xfrmsb, le centre de fréquence xfc,
l’écart type brut des fréquences xfstdb, la valeur efficace du spectre de puissance du signal frms , la
puissance d’enveloppe Pw [46], SPRI (Pic de spectre de la bague intérieure) et SPRO (Pic de spectre de
la bague extérieur) qui sont des indicateurs permettant de détecter les fréquences de défauts au
niveaux des bagues intérieure et extérieure. [45] propose les deux indicateurs SPRI et SPRO, pour
détecter les défauts dans la bague extérieure et intérieure dans le roulement, et d’autres.

26
a b
Figure 1. 8 Forme d’onde en (a) se transforme en un spectre en( b) Cette transformation est appelée
"transformée de Fourier rapide" [47]

Le Tableau 1.2 si dessous représente les Indicateurs statistiques dans le domaine fréquentiel. s(k) est un
spectre d’amplitude pour k= 1, 2 ..., k. K est le nombre de lignes spectrales, fk la fréquence de la k éme
ligne. PI (h), PO (h) sont les amplitudes de hme harmonique des fréquences indicateurs de la bague
intérieure et extérieure, h=1,2…H. H est le nombre d’harmoniques.

Tableau 1. 2 Indicateurs statistiques dans le domaine fréquentiel


1
K
∑k=1 (fk −fc)2 s(k) 2
Ecart type pondéré des fréquences xfstdb= ( ) (1.24)
K
∑k=1 s(k)
1
K 2
s(k) (1.25)
Valeur efficace fréquentielle xrmsf = (∑ ( ))
k=1 K
K
∑k=1 fk s(k)
Centre de fréquence xfc = K (1.26)
∑k=1 s(k)
1
K 2
∑ f2
k s(k)
Valeur efficace fréquentielle brut xfrmsb =( k=1
K ) (1.27)
∑k=1 s(k)

1 K
Valeur efficace du spectre de puissance du signal xrms = ∑k=1 s(k) (1.28)
K
1 K
Puissance d’enveloppe PW = ∑k=1 s 2 (k) (1.29)
K
K ∑H
j=1 PI (h)
Pic de spectre de la bague intérieure : SPRI = H (1.30)
∑j=1 S(fk )
H
K ∑j=1 PO (h)
Pic de spectre de la bague extérieur : SPRO = H (1.31)
∑j=1 S(fk )

4.1.2.2. Analyse d’enveloppe

L’approche fréquentielle est basée sur la détection de la signature d’un défaut particulier en se basant
sur l’enveloppe (High Frequency Resonance Technique, HFRT). Cette méthode permet de détecter des
chocs périodiques à partir des résonances de structure. L’analyse d’enveloppe repose sur l’étude du
signal enveloppe obtenu grâce à la transformée de Hilbert après filtrage dans une bande de fréquence
centrée sur une ou plusieurs résonances de structure [48]. La transformée de Hilbert est importante
dans le traitement du signal, elle permet de dériver la représentation analytique d’un signal à valeur
réelle [49]. La transformée de Hilbert d’un signal x(t) est définie comme la transformée dans laquelle
l’angle de phase de toutes les composantes du signal est décalé de ± 90. La transformée de Hilbert de
x(t) est représentée par x̂ (t) et elle est donnée par :
1 ∞ x(τ)
x̂ (t) = ∫ dτ
π −∞ t − τ (1.32)

27
Le traitement du signal à partir de la méthode d’enveloppe est un processus qui se déroule en deux
étapes. La première étape consiste à impliquer un filtrage passe-bande du signal dans le domaine
temporel, à l’aide d’un filtre passe-bande centré sur la région de l’énergie à haute fréquence. La
deuxième étape du processus consiste à appliquer la transformée de Hilbert sur le signal filtré pour
isoler l’enveloppe du signal modulé en amplitude. Les indicateurs de défauts et les harmoniques de
cette fréquence sont calculés à partir de la transformée de Fourier de l’enveloppe. Cette technique est
puissante pour la détection des défauts de roulement, car elle est basée sur la démodulation de la
résonance haute fréquence associée aux impacts des éléments porteurs [50].
Cette méthode basée sur l’analyse d’enveloppe est un moyen établi à la fois pour détecter
l’emplacement précis d’une défaillance précoce et pour surveiller la croissance des dommages des
éléments roulants [51].

a b
Figure 1. 9 Vibrations mesurées sur un roulement avec défaut. (a) accélération du temps, (b) spectre
d’enveloppe[51]

Figure 1.9 (a) montre les formes d’ondes typiques des signaux d’accélération pour un roulement
défectueux, (b) montre le spectre d’enveloppe pour le roulement défectueux, ici on distingue
parfaitement la fréquence BPFO, ce qui est significatif d’un défaut sur la bague externe.

4.1.2.3. Analyse cepstrale

L’analyse cepstrale est une méthode qui permet la détection de défauts à partir d’un spectre de
fréquences. Le cepstre est utilisé pour représenter les phénomènes périodiques qui sont dissimulés
par les spectres. La méthode de Fourier suppose que les signaux sont stationnaires. Or dans les
machines tournantes les signaux émis sont non stationnaires, donc pour effectuer la détection et
résoudre la limite de la méthode de Fourrier, on utilise l’analyse cepstrale.
Le cepstre c (τ) se définit comme l’inverse de la transformée de Fourier du logarithme décimal de la
transformée de Fourier du spectre d’amplitude du signal (|X(f)|), avec X(f)= TF[X(f)].

c(τ) = TF −1 (Ln |X(f)| ) (1.33)

a b
Figure 1. 10 (a) Signal temporel d’engrenage, (b) Cepstre : la fréquence de récurrence d’un défaut[52]

28
La figure 1.10. montre l’utilisation de l’analyse cepstrale pour la détection des défauts d’écaillage sur
les engrenages, ici par émission acoustique. Le cepstre indique la fréquence de récurrence d’un défaut
à 10Hz (roue principale), clairement convertie par un pic à 100 ms [52].

Cette méthode est importante pour suivre et chercher l’évolution des chocs répétitifs, comme ceux
qui sont créés par l’écaillage dans le roulement. Elle est largement utilisée pour la détection des
défauts d’engrenage et dans une moindre mesure pour les défauts de roulements [53].
4.1.2.4. Les limites de l’approche fréquentielle

Le diagnostic dans le domaine fréquentiel prend plus de temps que le domaine temporel afin de
pouvoir analyser les bandes de fréquences d’intérêt et avoir des spectres moyennés. Le temps
d’acquisition très long permet de différencier entre les fréquences relatives à la structure et sa
résonance et les fréquences d’intérêt. Les fréquences sont le plus souvent noyées dans le bruit dans
l’analyse spectrale ce qui rend difficile la visibilité des signatures des défauts de roulements si le niveau
du bruit de la machine est élevé [54]. De plus, l’analyse spectrale nécessite le plus souvent les
interventions d’un expert.
Analyse temps-fréquence

L’analyse temps fréquence permet d’analyser l’évolution temporelle de la caractéristique fréquentielle


du signal, représenter par la figure 1.11. Il est ainsi possible d’étudier des signaux non stationnaires.

Figure 1. 11 La relation entre les domaines temps et fréquence. (a) domaine temporel, (b) domaine
fréquentiel, (c) coordonnées tridimensionnelles représentant le temps, la fréquence et l’amplitude

Cette analyse donne des informations plus satisfaisantes que l’analyse spectrale classique, car l’analyse
en temps-fréquence permet d’analyser le signal en trois dimensions à savoir le temps la fréquence et
l’amplitude, et s’avère sensible aux défauts naissants. L’analyse temps fréquence est obtenue à partir
de la transformée de Fourier à court terme (TFCT), et la transformée de Wigner-ville [55].

La transformée de Fourier à court terme (TFCT) est une technique qui divise le signal original supposé
non stationnaire, en plusieurs segments qu’on assume stationnaire localement. Dans cette méthode
la transformée de Fourrier est appliquée sur le signal segmenté, et ainsi de suite sur les autres
segments. En pratique, nous pouvons dire qu’il n’y a pas de méthode ou bien d’analyse parfaite car
chacune d’elles détient des inconvénients et des avantages. En effet, si une répartition donne la

29
meilleure représentation pour un certain type de signal, d’autres distributions temps-fréquence
donnent une meilleure représentation pour d’autres types de signaux. La détérioration d’un défaut de
roulement n’entraîne pas juste une augmentation de l’amplitude des fréquences de vibration, mais
aussi la génération des harmoniques de ces fréquences en raison de la modulation d’amplitude.

La transformation de Fourier fenêtrée X(τ, f) est donnée par l’équation :



X(τ, f) = ∫ x(t)h(t − τ) e−j2πft dt
−∞ (1.34)

h(t), est le segment du signal x(t), τ est l’indice de positionnement temporel de cette fenêtre et donc
le positionnement de ce spectre.

La transformation de Wigner-Ville (TWV) s’écrit :


τ τ
Wx (t, f) = ∫ x (t + ) x ∗ (t − ) e−j2πft dt
−∞ 2 2 (1.35)

Le temps t et la fréquence f sont les deux variables de l’énergie finie de fonction, Wx (t, f). La
transformation de Wigner-Ville est une méthode d’analyse efficace grâce à sa bonne résolution en
temps et en fréquence. La Wigner-Ville permet une représentation précise des évolutions spectrales
associées à des changements rapides de la signature vibratoire des roulements [56]. Cependant, la
méthode Wigner-Ville présente des difficultés en raison de la présence de termes de brouillage
lorsqu’il s’agit de signaux à plusieurs composantes [57]. En prenant en considération les indicateurs de
la signature des roulements dans la sélection des fenêtres d’analyse et de filtrage temporel, le filtrage
de la Wigner-Ville permet de résoudre ce problème et d’extraire des indices importants sur le niveau
temps-fréquence [58].

4.1.3.1. Les limites de l’Analyse temps-fréquence

La principale limite de la transformée de Fourier à court terme est que la taille de la fenêtre de
réduction est fixe, et que le compromis entre le temps et la résolution de la fréquence peut être
optimale pour une certaine fréquence, mais pas pour d’autres [59]. Il existe cependant un inconvénient
bien connu à l’utilisation de Wigner ville Distribution. Lorsqu’un signal comporte plusieurs
composantes, la distribution de Wigner ville peut devenir difficile à interpréter. L’interférence entre
les deux composantes rend parfois difficile l’interprétation des propriétés du signal provenant de la
distribution de Wigner ville [60].
Analyse temps-échelle

La transformation en ondelettes est une technique similaire à la transformée de Fourier à court terme
(STFT) mais qui donne plus de flexibilité par rapport aux résolutions temporelles et fréquentielles [61].
L’analyse de la transformée en ondelettes représente un intérêt particulier car elle décompose les
signaux à une seule dimension dans un plan bidimensionnel. Cette transformée fournit des
informations temporelles du signal et simultanément dans le domaine échelle par une série
d’opérations de convolution entre le signal et une ondelette mère pour des facteurs d’échelle. La
transformée en ondelettes utilise des fonctions localisées à la fois dans l’espace réel et dans l’espace

30
de Fourier. Généralement, l’ondelette ψ(t) est une fonction continue, et est nulle au-delà d’un
segment de Ʀ et est exprimée par :

|ψ(ѕ)|2 (1.36)
∫ dt < +∞
Ʀ− |ѕ|

La transformée en ondelettes est en réalité un ensemble de transformations diverses et infinies,


dépendant de l’ondelette mère utilisée pour la calculer. C’est la raison principale pour laquelle nous
pouvons entendre le terme " transformée en ondelettes " dans des situations et des applications très
différentes. Les ondelettes fournissent une information d’échelle de temps d’un signal, permettant
l’extraction de Indicateurs qui varient dans le temps. Cette propriété fait des ondelettes un outil idéal
pour analyser des signaux de nature transitoire ou non stationnaire. En fait, grâce au développement
des ondelettes, l’analyse des signaux non stationnaires qui ne sont pas possibles par les autres
transformées comme Fourier, a été rendue possible.

L’utilisation de cette méthode nécessite de choisir l’ondelette mère, sa fonction et ses paramètres
(décroissance et fréquence). Ensuite, on doit faire varier le paramètre sur une plage de valeurs qui est
donné de façon arbitraire

On distingue deux types de transformations en ondelettes: la transformée en ondelettes continue et


la transformée en ondelette discrètes.

4.1.4.1. La transformée en ondelettes continue (TOC)

La transformée en ondelettes continue (TOC) est une implémentation de la transformation en


ondelettes utilisant des échelles arbitraires et des ondelettes pratiquement arbitraires. Les ondelettes
utilisées ne sont pas orthogonales et les données obtenues par cette transformée sont fortement
corrélées. Les impulsions dans le signal peuvent être détectées avec une bonne résolution en hautes
fréquences. Les ondelettes doivent être choisies en fonction du signal à analyser et l’objectif qu’il faut
atteindre de l’utilisation comme réduction de bruit du signal ou bien pour détecter des défauts. La
transformée en ondelettes continue nécessite un traitement du signal complexe. Par conséquent, TOC
peut prendre beaucoup de temps pour analyser les signaux de vibration des roulements [62].


(1.37)
C(a, b) = ∫ S(t)ψ(a,b) (t) dt
−∞
1 t−b (1.38)
ψ(a,b) (t) = ψ( )
√a a

La transformée en ondelettes continue C(a, b) permet de calculer l’index de ressemblance entre la


signal S(t) et l’ondelette ψ(a,b) (t) obtenu par la dilatation du facteur d’échelle a positif et de décalage
de position du paramètre de translation b de l’ondelette mère ψ(t).

31
Figure 1. 12 La transformée en ondelettes continue d’un défaut de bague extérieure[63]

La figure 1.12 représente la transformée en ondelettes continues d’un défaut de bague extérieure les
zones claires signifient des valeurs plus élevées des coefficients TOC et donc, le signal est très similaire
à l’ondelette. Les zones sombres signifient des valeurs plus faibles des coefficients TOC et montrent
que les versions correspondantes de l’ondelette en termes de temps et d’échelle sont différentes du
signal.

TOC fournit une bonne résolution en fréquence dans la gamme basse fréquence et une résolution fine
dans le temps dans la gamme haute fréquence. Une telle capacité multi-résolution est un avantage
pour le diagnostic de panne de machine basé sur les vibrations. L’analyse des ondelettes en utilisant
(TOC) est une méthode efficace pour détecter les défauts de la bague interne et des défauts de
l’élément roulant [64]. Une autre étude faite par [65], utilise une ondelette à réponse impulsionnelle
pour analyser les défauts d’un roulement à rouleaux. La transformée en ondelettes continue (TOC),
est utilisée par [66] pour détecter les changements brusques des signaux de vibration des roulements.
[67] ont également utilisé le TOC pour détecter des défauts uniques et multiples dans les roulements
à billes. [68] ont analysé les coefficients d’approximation et de détail du TOC pour la détection des
défauts de roulement.

4.1.4.2. La transformée en ondelettes discrète (DWT)

La transformée en ondelettes discrètes (DWT) est une implémentation de la transformée en


ondelettes utilisant un ensemble discret d’échelles et des translations en ondelettes obéissant à
certaines règles définies. En d’autres termes, cette transformée décompose le signal en un ensemble
d’ondelettes mutuellement orthogonales, ce qui est la principale différence avec la transformée en
ondelettes continues (TOC), où sa mise en œuvre pour la série temporelle discrète parfois appelée
transformée en ondelettes continue en temps discret (DT-CWT). Les ondelettes enfant
correspondantes sont données comme suit:
j
1 t−k∗2
ψ(a,b) (t) = ψ( ) (1.39)
√ 2j 2j
∞ j (1.40)
1 t−k∗2
D(a, b) = ∫ S(t) ψ( j
) dt
−∞ √ 2j 2

La transformée en ondelettes discrète D(a, b), avec S(t) et ψ(a,b) (t) sont des fonctions de la variable
discrète. Les valeurs de a= 2j , b=k ∗ 2j et (j, k) ∈ Z2 .

32
L’ondelette peut être construite à partir d’une fonction d’échelle décrivant les propriétés d’échelle du
signal.

Figure 1. 13 Exemple de détection des défauts de roulement par la transformée en ondelettes


discrète[69]

La figure 1.13 montre le défaut de roulement, où le signal de vibration mesuré sur un roulement à
billes avec une défaillance sur son chemin intérieur est traité par DWT.

La décomposition en ondelettes du signal donne une matrice W de coefficients c(a,b). Chaque ligne a
correspond à une fréquence fj , et chaque colonne b correspond à un moment t. L’enveloppe xmax(t) ,
est formée en conservant la valeur maximale de chaque colonne de la matrice W des coefficients. La
transformée de Fourier appliquée sur xmax(t) , nous donne le spectre du signal enveloppe. Le spectre
d’enveloppe permet d’obtenir deux indicateurs : le xWRMS qui est la valeur efficace des fréquences, et
le xPCWT qui est la valeur moyenne des amplitudes du spectre d’enveloppe. Dans l’article [70] l’auteur
a utilisé deux indicateurs xWRMS et xPCWT dans la détection de défaut dans le roulement qui sont
proposés par l’auteur dans l’article [71] pour détecter les défauts d’engrenage.

Tableau 1. 3 Indicateurs statistiques dans le domaine temps échelle


1
K 2
∑ fj2 WS (fj )
j=1 (1.41)
La valeur effective des fréquences : xWRMS = ( K )
∑ WS (fj)
j=1
K
∑ WS (fj)
j=1
La valeur moyenne des amplitudes d’enveloppe : xPCWT = (1.42)
K−1
WS (j) est le spectre des coefficients maximums de la transformée en ondelettes continue pour k = 1, 2…
K, K est le nombre de raies spectrales, fj est la valeur de fréquence de la jéme ligne de spectre.

4.1.4.3. Cyclostationnarité

La cyclostationnarité est une technique de traitement du signal qui appartient aux nouvelles
techniques modernes qui révolutionnent actuellement le domaine de l’analyse de signature
mécanique. Un signal dit cyclostationnaire est un signal qui présente une certaine périodicité cachée
de son flux d’énergie. Cette définition comprend une large gamme de signaux mécaniques tels que les
vibrations ou les mesures acoustiques. Cela est dû au fait que de nombreux systèmes mécaniques qui
prennent en charge le mouvement périodique de leurs composants ajustent à leur tour

33
périodiquement les vibrations ou le bruit qu’ils rayonnent. Le travail pionnier en cyclostationnarité
remonte au début des années 1960, mais est devenu une réalité de la recherche active depuis les
années 1980. WA Gardner a probablement été le premier à utiliser la technique cyclostationnaire dans
le diagnostic et la surveillance des machines tournante par l’analyse vibratoire [72]. Le mélange d’un
phénomène périodique et d’un phénomène aléatoire où la modulation d’un processus périodique par
un phénomène aléatoire génère un processus qui n’est pas périodique. La périodicité sous-jacente,
même si elle n’est pas présente dans le processus lui-même, est présente dans ses indicateurs
statistiques. Un tel processus est appelé cyclostationnaire. Le signal cyclostationnaire a des propriétés
statiques d’ordre 1 et 2, l’ordre 1 convient à la propriété moyenne, l’ordre 2 est la propriété
énergétique de corrélation qui devrait être périodique. Par l’analyse de la cyclostationnarité on peut
constater que la fréquence cyclique modulante permet de détecter la signature de défauts [73].

a b
Figure 1. 14 (a) Signal de vibration mesuré en cas de défaut de roulement de bague extérieure, (b) degré
de cyclostationnarité de la bague extérieure [74]

La figure 1.14 présente le signal avec un cas de défaut de roulement sur bague extérieure. Il est
caractérisé par la présence d’un certain nombre de fréquences de cycle non nul A1 jusqu’à A5,
correspondant respectivement à la fréquence BPFO du signal et à ses harmoniques.

De nombreuses recherches portent sur des méthodes basées sur des approches stationnaires de
second ordre. Ainsi la corrélation croisée définie par (Eq. 1.43) dépend uniquement de la variable de
rang τ.
τ τ (1.43)
R xx (t ; τ) = E[x ( t + ) x̅ (t − )]
2 2

En effet, un signal x(t) est dit stationnaire d’ordre n si tous ses moments, jusqu’au nième ordre, sont
indépendants du temps. Le signal x(t) est stationnaire à l’ordre 2 si son autocorrélation est
indépendante de t. Le signal x(t) est purement cyclostationnaire si son autocorrélation dépend de t de
façon périodique tel que : R xx(t ; τ) =R xx(t + T, τ).

Dans cette thèse, l’analyse cyclostationnaire est expliquée mais pas utilisée, car la méthode
cyclostationnaire présente également des inconvénients. Il s’agit notamment de la fuite spectrale des
signaux de grande amplitude, de leur non-linéarité, etc. La méthode est complexe sur le plan des
calculs et nécessite donc un temps d’observation beaucoup plus long et coûte également très cher. En
outre, lorsqu’un nombre insuffisant d’échantillons est utilisé, les performances de détection se
dégradent en raison de la mauvaise estimation de la densité spectrale cyclique.

34
Une étude faite par [75], a comparé de différentes méthodes de traitement de signaux : l’analyse
cyclostationnaire, la moyenne synchrone dans le temps, le cepstre et la transformée en ondelettes
dans le domaine de détection de défauts d’engrenage. Ils ont démontré que l’analyse cyclostationnaire
avec une corrélation spectrale est efficace pour surveiller les fissures dans l’engrenage. Une étude faite
par [76] constate que les signaux de vibration d’engrenages ont une cyclostationnarité de second
ordre, et avec la corrélation spectrale ils peuvent détecter de façon précoce l’écaillage des dents
d’engrenage. L’efficacité de la cyclostationnarité a déjà été étudiée par [77] pour surveiller l’état des
boîtes de vitesses. Le diagnostic des défauts des machines tournantes, fut aussi étudié par [78]. [79]
ont proposé un indicateur d’énergie cyclique qui est presque équivalent à l’évaluation de la
dégradation des roulements des éléments roulants.

4.1.4.4. La décomposition en mode empirique

La décomposition modale empirique (EMD) est une méthode adaptative d’analyse spatio-temporelle
qui est largement utilisée pour analyser le signal non stationnaire et non linéaire, [80]. Cette méthode
sert à partitionner un signal complexe en série d’IMFs, (Intrinsic Mode Functions). Ces IMFs sont
utilisées comme base pouvant être linéaire ou non linéaire suivant les données, et leur combinaison
linéaire est une représentation efficace des signaux d’origine.

L’algorithme EMD peut être résumé comme suit.

1) Retrouver tous les extrema (max et min) du signal x(t).


2) Interpoler le maxima du signal Emax (t) respectivement Emin (t).
Emax (t)+ Emin (t)
3) Calculer la moyenne locale x̅(t)= 2
.
4) Extraire et optimiser le signal d’entrée f(t) = x(t) − x̅(t).
5) Tester si f(t) est une IMF (Intrinsic Mode Functions), en utilisant les conditions
suivantes:

 Si oui, procédure à partir de l’étape 1 concernant signale f(t) = x(t) − x̅(t),


est répétée.
 Si non, remplacer x(t) par f(t) et répéter la procédure à partir de l’étape 1.

Le signal x(t) est décomposé par EMD comme:

x(t)=∑N
k=1 IMFn (t) + r(t) (1.44)

avec N représente est le nombre IMF, et r(t) est la tendance moyenne ou le résidu.

IMF1 (t) contient les composantes de fréquence les plus élevées qui apparaîtront dans les IMF de telle
manière que la composante de fréquence la plus basse se trouve dans IMFn (t). Ces composantes de
fréquence changent avec la variation du signal x(t). La figure 1.15 illustre un exemple de décomposition
pour roulement avec défaut sur la bague extérieure.

35
a b

c
Figure 1. 15 (a) Signal mesuré, (b) son spectre, (c) et les quatre premières IMFs issues de l’EMD du signal
[81]

L’EMD est largement étudié et utilisé pour surveiller l’état de vibration des systèmes rotatifs, tels que
les roulements, les engrenages, les défauts causés par les charges [82],[83]. [84] propose d’utiliser
conjointement la décomposition EMD et le spectre enveloppe pour diagnostiquer les défauts dans le
roulement. La technique EEMD (the ensemble empirical mode decomposition) peut fournir un outil
puissant pour d’ébruiter les signaux sismiques, cependant elle peut déformer le signal de vibration, ce
qui cause une perte d’information, provoque une fausse alarme et une détection de défaut inexacte,
[85]. La méthode ESMD (Extrême-point symétrique mode décomposition) a été efficacement
appliquée dans de nombreux domaines différents, comme dans la détection de défauts de roulements
par [85].

36
CONCLUSION
Ce chapitre réalise une étude générale sur les différents types de roulements, les principaux défauts
dans le roulement et les méthodes de détection qui existent. Les diverses méthodes et techniques
d’analyse des vibrations appliquées sont rappelées et discutées : les analyses temporelles,
fréquentielles, temps-fréquence et temps-échelle. D’après tous ces éléments, on peut dire qu’il
n’existe pas de méthode universelle et autonome permettant de détecter de manière assez précoce
tous les types de défauts que l’on est susceptible de rencontrer sur une machine tournante.
Néanmoins la combinaison et l’association de plusieurs méthodes permettraient un diagnostic plus
fiable et plus rapide.
Par exemple l’analyse temporelle constitue une méthode efficace pour détecter les défauts dans le
roulement en temps réel, mais cette analyse a des limites car on ne peut pas localiser le défaut sur un
élément précis du roulement. En revanche, l’analyse fréquentielle permet de situer sur quel
composant le défaut est présent. L’avantage de l’analyse fréquentielle par rapport à l’analyse
temporelle est sa possibilité de déterminer et de séparer facilement certaines composantes
fréquentielles intéressantes. Cependant, la perte d’une quantité importante de données (transitoires,
composantes non répétitives du signal) au fil du traitement est un inconvénient majeur. Il en va de
même pour l’analyse temps-fréquence caractérisée par un long temps de calcul et l’utilisation limitée
à une vitesse faible. Il est également compliqué de mettre en place des seuils de référence dans cette
approche, ce qui rend le système de surveillance incapable de donner l’état des machines de façon
autonome. La transformée en ondelettes ou analyse temps échelle est actuellement utilisée pour
résoudre à la fois le problème de l’information temporelle et celui de la mauvaise résolution. Un
avantage majeur de la transformée en ondelettes est que cette méthode peut montrer les indicateurs
locaux des signaux et donner un compte-rendu de la façon dont l’énergie est diffusée sur les variations
de fréquence d’un moment à l’autre.

On peut conclure que la combinaison des différentes méthodes d’analyse semble être un moyen
prometteur de surveiller l’état général de fonctionnement des machines, de mettre en évidence la
défaillance des composants et d’identifier la source de cette défaillance. De nos jours, notamment
avec l’ère de l’industrie 4.0, il est intéressant de trouver de nouvelles méthodes efficaces associant les
différents traitements. Parmi elles l’utilisation de la méthode de reconnaissance de formes peut
s’avérer rapide et efficace dans plusieurs domaines et plus précisément dans la détection de défaut
dans la machine tournante.

Le chapitre suivant sera consacré à l’étude des différentes méthodes de reconnaissance de formes
dynamique et statique, supervisée et non-supervisée, spécialement appliquées au diagnostic de défaut
de roulement.

37
CHAPITRE II
LES METHODES DE RECONNAISSANCE DE FORMES POUR LA SURVEILLANCE DES
DEFAUTS DES COMPOSANTS MECANIQUES.

38
INTRODUCTION
La reconnaissance de formes (RdF) a pour but de mettre au point les outils informatiques permettant
de reconnaître les formes. Elle a été considérée depuis longtemps dans le domaine de l'intelligence
artificielle notamment dans la construction de robots ayant la possibilité d'apprendre, de réfléchir et
aussi d'interagir avec le monde extérieur et donc de reconnaître des objets. Dans ce contexte, son rôle
initial a été de générer tous les algorithmes nécessaires à la compréhension théorique. La RdF est
actuellement devenue une discipline fondatrice du secteur de l'apprentissage automatique avec
l'algorithmique, la logique, la physique statistique, les probabilités, les statistiques et la théorie de
l'évolution.

L’objectif de ce chapitre est de présenter les concepts et les principes de la RdF statique et dynamique
sur lesquels la suite de cette thèse sera basée, et de faire ressortir la différence qui existe entre les
diverses méthodes de classification supervisée, non supervisée et semi-classifiée. Une part importante
de ce chapitre sera destinée à une synthèse des différentes méthodes classiques de classification
proposées dans la littérature.

Généralités sur les méthodes de Reconnaissance de Formes


(RdF)
Les progrès réalisés dans la collecte de données dus à l’automatisation et l’informatisation de
nombreux systèmes d’exploitation et processus dans les environnements techniques et scientifiques,
ainsi que les progrès dans les technologies de stockage des informations, au cours de la dernière
décennie, ont permis de conserver dans des bases de données, de grandes quantités de données.

L’analyse et l’extraction d’informations précieuses à partir de ces données sont devenues un problème
majeur, qui a considérablement retenu l’attention des chercheurs. La reconnaissance de formes est le
domaine de recherche qui fournit la majorité des méthodes d’extraction de données et vise à aider les
humains à analyser automatiquement les structures de données complexes. Les systèmes de
reconnaissance de formes peuvent être utilisés comme alternatives lorsque les experts humains sont
rares dans des domaines spécialisés ou dans des situations dangereuses telles que la détection de
défauts dans les centrales nucléaires [86]. Elle peut fournir un support précieux dans le processus du
contrôle qualité afin de travailler en continu avec des performances constantes et détecter les défauts
dans les machines tournantes [87].

Le concept de reconnaissance de formes consiste en la recherche automatique de formes dans les


données par l’utilisation d’algorithmes informatiques et l’utilisation de ces formes pour effectuer des
actions telles que la classification des données en différentes classes. Habituellement les données sont
stockées dans des bases de données structurées et organisées. Ces données sont composées de lignes
et de colonnes. Les colonnes sont des attributs (nombres ou chaînes de texte) associés à une table
(entité), à laquelle on accède par des liens entre les attributs des tables (relations). Le mot forme doit
être compris de façon très générale, non seulement dans le sens de "forme géométrique" mais aussi
dans le sens de motifs dont la nature peut être très variée, visuelle (code barre, visage, etc.) industrielle
(signal vibratoire) ou sonore (reconnaissance vocale) ou multi spectrale (images satellites) ou bien
d’autres encore [88].

39
L’avènement de la technologie de stockage des données a permis aux entreprises de collecter de
grandes quantités de données historiques qui décrivent le comportement temporel d’un système
étudié, ces bases de données ont permis de développement d’un nouveau type d’analyse telle que la
reconnaissance de formes afin d’obtenir une meilleure aide à la décision. La caractéristique commune
à toutes ces applications (reconnaissance vocale, imagerie spectrale, analyse vibratoire, etc.) est qu’au
fil du temps, les objets étudiés changent d’états au cours du temps. L’ordre de l’état, ou l’ensemble
d’états pris par un objet, détermine si l’objet appartient à un modèle ou une classe spécifique. En
d’autres termes, l’histoire du développement temporel d’un objet a une forte influence sur l’issue du
processus de reconnaissance. Ces objets, qui représentent des observations d’un système et
contiennent une histoire de leur développement temporel, sont appelés systèmes dynamiques.

Le processus de RdF est constitué de 4 grandes étapes : l’acquisition; l’extraction ; la classification et


finalement la décision.

Acquisition des données: il s’agit d’enregistrer les données (des signaux) issus du (ou des) capteurs(s).
Ces signaux peuvent être de nature très différente (électrique, acoustique, vibration, température,
pression, images, etc.).
Extraction: il s’agit de définir et de calculer des paramètres indicateurs des "objets" à classer à partir
des signaux bruts ou prétraités. Les indicateurs peuvent être qualitatifs et/ou quantitatifs.
Classification: cela consiste à attribuer de façon automatique un objet à une classe parmi d’autres
possibles. Chaque classe a ses propres indicateurs et peut être définie par un modèle, représentée par
une fonction d’appartenance. Chaque modèle est établi par un ensemble de règles de décision
permettant d’attribuer une forme à une classe. La méthode de classification se résume en la
caractérisation du modèle et de l’étiquette de chaque classe associée à une forme [89]. Cela nécessite
des méthodes qui permettent de regrouper, par apprentissage, les formes similaires. Généralement,
les processus de la RdF sont présentés par la figure 2.1.
Décision: la décision d’intervention est prise lorsqu’il y a une évidence expérimentale de défaut
imminent ou d’un seuil de dégradation prédéterminé.

Objets Extraction des


Acquisition Classification Décision
à classifier caractéristiques

Figure 2. 1 Processus de la reconnaissance de formes

Les différentes approches de reconnaissance de formes

On rencontre couramment quatre grandes méthodologies dans les (RdF) [89], à savoir : l’approche
statistique, l’approche syntaxique, la mise en correspondance de modèles, et les réseaux de neurones.

Approche statistique

En général, les RdF statistiques sont basées sur des statistiques et des probabilités [90]. Dans ces
systèmes, les indicateurs sont convertis en nombres qui sont placés dans un vecteur pour représenter
le modèle. Cette approche est la plus utilisée dans la réalité car c’est la plus facile à appliquer. On la
retrouve dans plusieurs domaines comme l’automatisation industrielle, l’inspection des cartes de
circuits électroniques, la reconnaissance de la parole, la télédétection, la bio-informatique. Dans cette
approche, les modèles à classer sont représentés par un ensemble d’indicateurs définissant un vecteur

40
multidimensionnel spécifique : ce faisant, chaque modèle est représenté par un point dans l’espace
des indicateurs multidimensionnel. Pour comparer les modèles, cette approche utilise des mesures en
observant les distances entre les points dans l’espace. Pour plus de détails et des considérations plus
approfondies sur cette approche, on peut se référer à [90] qui présente une étude des approches
statistiques de reconnaissance de formes. Dans cette approche, plusieurs méthodes ont été
développées comme la méthode de transformation Probabilité–Possibilité [91]. Parmi les algorithmes
utilisant une approche statistique, on peut citer l’algorithme Fuzzy C-Means [92] qui est une technique
largement utilisée dans les problèmes de segmentation et de classification d’images, l’algorithme des
K plus proches voisins (K-PPV)[93] qui est une méthode de classification non paramétrique utilisée
pour la classification et la régression. Dans les deux cas, il s’agit de classer l’entrée dans la catégorie à
laquelle appartient les k plus proches voisins dans l’espace des indicateurs identifiés par apprentissage.

Approche syntaxique

Cette approche est utilisée dans la reconnaissance de la parole, des caractères et des grammaires
syntaxiques. L’approche structurelle en reconnaissance de formes considère que la nature d’un objet
à reconnaitre tient d’une part à la nature des parties élémentaires qui le constitue et d’autre part aux
relations entre ces différentes parties. La stratégie employée dans les approches structurelles est
constituée de deux étapes. On identifie tout d’abord les éléments constituants un objet à l’aide de
techniques le plus souvent simples. Puis on utilise des techniques de reconnaissance structurelle pour
reconnaitre l’objet (déterminer sa classe), représenté par ses éléments constituants et par leurs
relations [94].

L’algorithme Cocke-Younger-Kasami est un algorithme d’analyse pour les grammaires non


contextuelles. Il utilise une analyse ascendante et une programmation dynamique. Les analyseurs LR
sont un type d’analyseur ascendant qui analysent les langues déterministes [95] sans contexte en
temps linéaire [96].

Mise en correspondance des modèles

La correspondance de modèles est une technique de traitement des images numériques qui permet
de trouver les petites parties d’une image qui correspondent à un modèle d’image [97]. Cette
technique peut être utilisée dans le secteur de la fabrication dans le cadre du contrôle qualité, pour
guider un robot mobile [98] ou pour détecter des bords dans des images [99]. Dans la reconnaissance
de formes visuelles, on utilise la fonction de modèle pour comparer l’image d’entrée en maximisant la
corrélation croisée spatiale ou en minimisant une distance : cela donne le taux de correspondance. Les
algorithmes réalisés dans cette approche sont la Corrélation Croisée Normalisée (CCN)[100], la Somme
des Différences Absolues (SDA)[101], la Somme des Différences au Carré (SDC)[102]. Les principaux
problèmes rencontrés dans la correspondance des modèles sont les suivants : masquage et détection
des transformations non rigides.

Réseaux de neurones

En règle générale, un réseau neuronal artificiel est un processus auto-adaptatif pouvant être formé et
capable d’apprendre à résoudre des problèmes complexes sur la base des connaissances disponibles
[103]. Un ensemble de données disponibles est fourni au système afin qu’il trouve la fonction la plus
adaptée parmi une classe de fonctions autorisées qui correspond à l’entrée. Un système basé sur le
réseau neuronal artificiel simule le fonctionnement du cerveau biologique : il est composé d’éléments

41
de traitement interconnectés qui simulent les neurones. Grâce à cette interconnexion (ou synapse),
chaque neurone peut faire passer des informations à un autre [104]. Les réseaux neuronaux basés sur
un logiciel de calcul amélioré ont récemment attiré l’attention en raison de leur précision supérieure
à celle des méthodes conventionnelles. Les réseaux neuronaux avancés simulent le système visuel
humain et atteignent une précision équivalente à celle de l’homme dans la classification des images,
la détection des objets et la segmentation. Les réseaux de neurones artificiels de filtrage sont
généralement formés à l’aide de techniques d’apprentissage supervisé. La Reconnaissance Optique de
Caractères (ROC)[105] est une application dans laquelle les réseaux neuronaux artificiels ont été
largement utilisés.

Dans la figure 2.2 la représentation de réseaux de neurones artificiels peut être décrit comme des
systèmes composés d’au moins deux couches de neurones : une couche d’entrée et une couche de
sortie et comprenant généralement des couches intermédiaires, les neurones [104]. Plus le problème
à résoudre est complexe, plus le réseau de neurones artificiels doit comporter de couches. Chaque
couche contient un grand nombre de neurones artificiels spécialisés. Dans le réseau de neurones
artificiels, le traitement de l’information suit toujours la même séquence : les informations sont
transmises sous la forme de signaux aux neurones de la couche d’entrée, où elles sont traitées[106].
À chaque neurone est attribué un poids particulier, et donc une importance différente. Associé à la
fonction dite de transfert, le poids permet de déterminer quelles informations peuvent entrer dans le
système. Deuxième étape, une fonction dite d’activation associée à une valeur seuil calcule et pondère
la valeur de sortie du neurone. En fonction de cette valeur, un nombre plus ou moins grand de
neurones sont connectés et activés. Cette connexion et cette pondération dessinent un algorithme qui
fait correspondre un résultat à chaque entrée. Chaque nouvelle itération permet d’ajuster la
pondération et donc l’algorithme de façon à ce que le réseau donne à chaque fois un résultat plus
précis et fiable [106].

Figure 2. 2 Représentation d’un réseaux de neurones [106]

La méthode de reconnaissance de formes des données dynamiques

Cette section repose sur l’approche statistique, où les données se présentent comme des vecteurs de
mesure, cette approche est la plus appropriée à nos exigences car elle permet de suivre dans le temps
l’état de fonctionnement d’une machine tournante.

Il y a essentiellement deux problèmes associés à la reconnaissance dynamique des formes [107] :

 Détecter tout changement dans la structure de la classe.


 Réagir à tout changement détecté.

42
La surveillance d’un système évolutif permet de résoudre tout changement dans la classe, en suivant
les activités du classifieur par l’observation et l’évaluation de certaines mesures calculées sur la base
des données de la classification de nouveaux objets. Le processus de reconnaissance de formes
cherche ainsi à déterminer dans quelle mesure les nouveaux objets qui arrivent à un moment donné
sont intégrés dans la classe existante. Plus particulièrement, si les nouveaux objets ne correspondent
pas à la structure de la classe existante et que la performance du classifieur est plutôt faible, on
suppose que des changements ont eu lieu. Il peut y avoir deux raisons pour le changement de la
structure de classe au cours du temps :

• Le nombre d’indicateurs pertinents peut diminuer ou augmenter avec le temps.


• Le nombre d’indicateurs reste le même, mais les valeurs de certaines entités modifient leur
plage ou leur interprétation.

Les différents types de reconnaissance de formes dynamique

Une reconnaissance de formes dynamique est liée à un modèle capable de se développer au fil du
temps selon l’incorporation de nouvelles données. Suivant le type de système étudié, les formes ainsi
obtenues pourront donc être dynamiques ou statiques suivant l’évolution des indicateurs dans le
temps. Selon [108], on peut faire face à quatre scénarios qui sont la combinaison de deux types de
formes et de deux types de classes. Cette combinaison demande un traitement particulier qui est
présenté ci-dessous.

Reconnaissance de formes statique - objets statiques

Il s’agit de la reconnaissance de formes la plus classique. Des données statiques sont des données qui
gardent les mêmes propriétés statistiques au cours du temps. Par conséquent, le problème qui se pose
ici concerne la classification de objets dont les indicateurs restent inchangés par rapport aux
indicateurs connus. Il faut classer ces objets dans des classes statiques qui ne se déplacent donc pas
dans les espaces de représentation. Le classifieur utilise ces objets et classes statiques comme
ensemble d’apprentissage, qui reste identique dans le temps [108].

L’apparition de nouvelles données (bruitées ou non) permettra de préciser les fonctions


d’appartenance estimées par le classifieur. Dans ce cas, de petites transformations de la classe sont
effectuées, de manière incrémentale ou non, et permettent d’améliorer les résultats de la
classification [107]. Parfois, lorsqu’un traitement hors ligne peut être effectué, il peut être préférable
de recommencer complètement la phase d’apprentissage en réapprenant un ensemble de nouvelles
données plus informatives.

Par opposition à ce type de reconnaissance de formes, les trois cas suivants constituent la
reconnaissance de formes dynamique. En fait, dès qu’un système produit des objets dynamiques et/ou
des classes dynamiques, il faut utiliser un classifieur dynamique.

Reconnaissance de formes dynamique - objets statiques

La reconnaissance de formes dynamiques d’objets statiques utilise des indicateurs qui évoluent au
cours du temps. Le temps est donc un facteur important à prendre en compte pour éviter que les
performances du classifieur ne se détériorent. Cette évolution des indicateurs de la classe peut se
traduire par un déplacement, une scission, une fusion, une rotation, etc. Ces changements sont dus à
des modifications progressives ou brutales des modes de fonctionnement d’un système. Une évolution

43
est abrupte si le point apparaissant au temps t+1 ne se trouve pas dans la même classe que le point
apparaissant au temps t (voir figure 2.3). La prédiction de cette évolution est dans ce cas impossible à
réaliser et il est impossible de prévoir l’évolution par une méthode dynamique. Dans le cas d’une
nouvelle classe, une méthode de classification non supervisée ou semi-supervisée pourra identifier ses
indicateurs. L’évolution progressive est définie par l’apparition de plusieurs points intermédiaires, soit
des objets transitoires, entre un point au début de l’évolution et un point à la fin de l’évolution. On
peut alors considérer que ces points intermédiaires ne représentent qu’un seul lien [1].

Figure 2. 3 Exemple d’evolution abrupte

Ainsi, le problème de la reconnaissance de formes dynamique avec objets statiques réside dans la
reconnaissance de formes d’états de système typiques basés sur des objets statiques afin de détecter
et de suivre les changements temporels de la structure de classes en ajustant la structure du classifieur,
et d’essayer de prédire le futur système état.

Reconnaissance de formes statique - objets dynamiques

Cette situation concerne la reconnaissance d’états typiques d’un système unique ou de classes de
systèmes ayant un comportement similaire, sur la base de l’analyse de l’évolution d’un système dans
le temps. Les objets sont représentés par des trajectoires multidimensionnelles, ou séries temporelles,
décrivant le comportement d’un système dynamique. Le problème de la reconnaissance de formes
statique dans cette situation est de mettre en évidence les classes basées sur un comportement
similaire des trajectoires. Il existe un grand nombre d’applications dans lesquelles la classe et la
classification des objets dynamiques sont évoluer tandis que la structure du classe reste inchangée
dans le temps [108].

Reconnaissance de formes dynamique - objets dynamiques

Ce type de reconnaissance de formes correspond à celui des formes dynamiques dont les indicateurs
évoluent dans le temps. Ainsi, la structure d’une forme dynamique change de façon progressive ou
abrupte. Cette évolution des indicateurs conduira les formes dynamiques à évoluer en classe au fil du
temps. La méthode de reconnaissance de formes devra alors constater une modification de la
structure des formes. Cette évolution peut correspondre à une dégradation évolutive ou brutale du
fonctionnement d’un système. Dans ce cas, la méthode de classification dynamique doit donc
reconnaître que ce changement ne fait pas partie de la structure normale, d’un signal mais qu’il y a
une évolution du système. Cette classification dynamique des données est la plus adaptée à la
surveillance des roulements parce que la signature vibratoire d’un roulement évolue dans le temps,
entraînant l’évolution des classes qui les représentent [1].

44
Dynamique des classes

En raison du caractère non stationnaire des données dans la reconnaissance dynamique des formes,
la partition des objets n’est pas nécessairement fixée dans le temps. Le nombre de classes et
l’emplacement des centres de classes, à un moment donné, constituent la structure de la classe. Il peut
être statique ou dynamique. Si le nombre de classes est fixe et que seul l’emplacement des centres de
classes change légèrement au fil du temps, cette structure de classes peut être considérée comme
statique [109]. Si au fil du temps le nombre de classes et l’emplacement des centres de classes varient,
alors la structure des classes est dynamique [1]. Son développement temporel est représenté par les
trajectoires des centres de classes dans l’espace caractéristique. Les changements dans la structure
des classes correspondent aux changements d’état ou de comportement d’un système à l’étude et
seront également appelés changements structurels. En raison de l’arrivée de nouveaux objets et de
l’élimination des anciennes données non pertinentes, les changements suivants dans la structure
dynamique des classes peuvent apparaître :

 Formation de nouvelles classes : si les nouvelles données ne peuvent pas être clairement
affectées aux classes existantes, une ou plusieurs nouvelles classes peuvent être formée par
ordre l’une après l’autre, ou en parallèle c’est-à-dire de la première classe à de nombreuses
classes différentes. Cette situation peut apparaître si les degrés d’appartenance des nouvelles
données à toutes les classes existantes sont approximativement égaux ou très faibles. Si de
nouvelles données ne peuvent pas être affectées à des classes existantes et que leur nombre
n’est pas suffisamment important pour former une nouvelle classe, ces nouvelles données
sont reconnues comme étant errantes. La figure 2.4 illustre les points qui correspondent à des
observations de classes dynamiques à différents moments dans le temps [107].
 Fusion de classes : deux classes ou plus peuvent être fusionnées en une seule classe, figure
2.4, c. Si un grand nombre de nouvelles données ont des degrés d’adhésion (> 0,5) tout aussi
élevés à deux classes, ces deux classes ne peuvent plus être considérées comme hétérogènes
et en revanche, sont considérées comme similaires et doivent être fusionnées[108].
 Fractionnement de classes : une classe peut apparaître comme deux classes ou plus (figure 2
4, b), si une grande quantité de nouvelles données a été recueillie, les classes sont séparées
par la notion de densité. La haute densité se formera à l’intérieur d’une classe, tandis que la
zone de faible densité se situera au centre de la classe. Alternativement, il peut arriver
qu’aucune nouvelle donnée ne soit absorbée dans une classe et que les anciennes données
soient rejetées comme non pertinentes. En raison de la suppression des anciennes données,
une zone ayant une très faible densité de données, ou même vide, peut apparaître autour du
centre de la classe et dans une certaine direction séparant les données en deux ou plusieurs
classes. Une classe ne peut plus être considérée comme homogène et doit être divisée pour
former la meilleure partition [1].
 Destruction des classes : une ou plusieurs classes peuvent disparaître s’il n’y a pas de nouvelles
données attribuées à ces classes et que les anciennes données sont supprimées. Le centre de
classe doit cependant être sauvegardé afin de préserver les connaissances découvertes. Il peut
arriver que cette classe réapparaisse à l’avenir. Dans ce cas, une nouvelle classe peut être
reconnue et identifiée plus rapidement si les connaissances sur cette classe existent déjà et
n’ont pas besoin d’être apprises à nouveau [108].
 Glissement des classes : l’emplacement des centres de classe dans l’espace caractéristique
peut être légèrement modifié au fil du temps [1].

45
a b c d
Figure 2. 4 (a) Formation d’une nouvelle classe au temps t2 (b) Formation de deux nouvelles classes B et C
apparaissent au temps t5 (c) Fusion des classes B et C (d) Scission de la classe B

Les quatre premiers types de changements structurels représentent des changements brusques dans
la structure de la classe. Dans de nombreuses applications, des changements brusques sont associés à
des défauts de comportement opérationnel d’un système, qui doivent être détectés le plus tôt possible
pour éviter des conséquences dangereuses. Le cinquième type de changements structurels est appelé
changement progressif, ce qui peut être utile pour prévoir l’occurrence de changements brusques. Ils
sont généralement très petits et assez difficiles à détecter, mais peuvent être d’une grande importance
dans certaines applications [109].

Les méthodes de RdF pour la surveillance des défauts de


roulements
La figure 2.5 résume les différentes étapes de la reconnaissance de formes dans le cadre du diagnostic
de défaut de roulement.

Machine Extraction des Réduction


tournante Acquisition
caractéristiques de Classification Décision
des signaux
à surveiller Normalisation dimension

Figure 2. 5 Résumé de la RdF dans le cadre du diagnostic de défaut de roulement [1]

Acquisition

La collecte des données pour constituer une base de données se fait à partir des capteurs qui peuvent
être de nature différente (vibratoire, électrique, acoustique, etc.). La qualité des données extraites
sera affectée par le type de capteurs utilisés [110], la sensibilité par rapport au bruit [111] et la position
du (ou des) capteurs sur la machine [111]. Pour améliorer la qualité des données de détection[112],
un rapport signal / bruit élevé doit être maintenu [113]. Ceci peut être réalisé en réglant sélectivement
les caractéristiques métrologiques du capteur (la bande passante, la sensibilité).

Le système d’acquisition de données est un ensemble de logiciels et de matériels qui permettent de


mesurer ou de contrôler les indicateurs physiques en temps réel. Un système d’acquisition de données
complet se compose de matériel d’acquisition de données, de capteurs et d’actionneurs, ainsi que de
matériel de traitement de signaux et d’un ordinateur équipé d’un logiciel d’acquisition de données
[114].

Un capteur est un dispositif qui convertit une propriété physique en un signal électrique
correspondant. Un système d’acquisition pour mesurer différentes propriétés dépend des capteurs

46
qui sont adaptés pour détecter ces propriétés. Un conditionnement du signal peut être nécessaire si
le signal du transducteur ne convient pas au matériel d’acquisition utilisé. Le signal peut devoir être
filtré, mis en forme ou amplifié dans la plupart des cas.

Dans la mise en œuvre d’une surveillance par analyse vibratoire, les accéléromètres sont la meilleure
option car ils sont simples, faciles à appliquer et très sensibles aux vibrations à haute fréquence
généralement générées en cas de défaillance mécanique [115]. Les accéléromètres industriels sont
généralement fabriqués à partir de l’une des deux technologies suivantes : les accéléromètres
piézoélectriques [116], et les accéléromètres MEMS [117]. Dans ce travail de thèse, le capteur utilisé
est un accéléromètre piézoélectrique.

Extraction des indicateurs

Cette étape consiste à extraire des paramètres représentatifs de l’état de fonctionnement d’un
système à surveiller. Ces paramètres que l’on appelle "indicateurs de défaut" peuvent être extraits à
partir du signal brut ou du signal prétraité. Ils peuvent être temporel, fréquentiel ou issus d’un autre
traitement comme la décomposition en ondelettes (temps-échelle), la décomposition empirique
modale ou de l’exploitation de la nature du signal comme la cyclo-stationnarité. Ces indicateurs furent
discutés dans le chapitre 1.

Normalisation des données

La normalisation des données est un type de processus qui consiste essentiellement à réorganiser les
données dans une base de données de manière à ce que les utilisateurs puissent utiliser correctement
cette base de données pour des recherches et des analyses plus approfondies. La normalisation des
données consiste à transformer les indicateurs dans une échelle commune de sorte que les valeurs
numériques les plus élevées ne peuvent pas dominer les valeurs numériques les plus faibles. L’objectif
principal est de minimiser le déséquilibre des indicateurs dont la valeur numérique est plus élevée
dans les classes de motifs discriminants. La normalisation est utile pour les méthodes d’apprentissage
statistique, car tous les indicateurs des données jouent un rôle égal dans le processus d’apprentissage.

Les techniques de normalisation ont été utilisées par de nombreux chercheurs pour améliorer les
performances de la classification dans différents domaines d’application. La normalisation des
indicateurs a été appliquée par [118], pour détecter les défauts dans le roulements à rouleaux en cas
de variation des vitesses de rotation. La normalisation des données aussi été appliquée dans [119]
avant d’utiliser le méthode de classification pour le diagnostic des défauts de roulements.

Il existe de nombreuses techniques de normalisation, mais deux méthodes sont très courantes : à
savoir la normalisation Min-Max utilisée par [120] dans le diagnostic des défauts de roulement et la
normalisation Z-score qui est utilisée dans l’article [121] pour le diagnostic intelligent des machines
tournantes.

Sélection des indicateurs

La sélection des indicateurs consiste à trouver un sous-ensemble de l’ensemble original de variables,


ou fonctionnalités, pour obtenir un sous-ensemble plus petit. Il existe trois méthodes pour obtenir un
sous ensemble d’indicateurs : Filtre, Enveloppante (Wrapper), Intégré [122].

47
Les méthodes de filtrage utilisent des techniques statistiques pour évaluer la relation entre chaque
variable d’entrée et la variable ciblée, et ces résultats sont utilisés comme base pour filtrer les variables
d’entrée qui seront utilisées dans le modèle. C’est une méthode d’apprentissage non supervisée. Les
méthodes basées sur un filtre sont plus rapides que les méthodes enveloppantes dites Wrapper. Parmi
les méthodes de filtre on cite : la méthode Relief [123], le gain d’information [124], le test du Khi carré
[119], etc. La procédure du modèle filtré est illustrée par la figure 2.6.

Figure 2. 6 La procédure du modèle filtré [128] X={xk|𝐱 𝐤 |=𝐱 𝐤𝟏 , 𝐱 𝐤𝟐 ,…., 𝐱 𝐤𝐦 ), k=1.2,…,m} un ensemble de m
indicateurs dans un espace de représentation comportant n indicateurs

Les méthodes enveloppantes (Wrapper) recherchent le meilleur sous-ensemble de l’ensemble original


de variables. Pour évaluer la qualité d’un sous-ensemble de variables, ces méthodes s’appuient sur
l’algorithme de classification et interagissent avec sa capacité à discriminer entre les classes. La
procédure du modèle Wrapper est illustrée par la figure 2.7.Des techniques d’optimisation standard
sont basées sur la méthode de Wrapper, telles que les algorithmes génétiques, les algorithmes random
stepwise [125], les algorithmes de sélection de indicateurs de défauts séquentiels (Sequential Forward
Selection, SFS) [126] etc.

Les méthodes intégrées recherchent parmi différents sous-ensembles de l’ensemble original de


variables. Contrairement aux méthodes enveloppantes, le processus est étroitement lié à un modèle
de classification spécifique et tire parti de ses indicateurs de défauts et de sa structure. En plus des
approches de sélection des données, dans lesquelles un sous-ensemble de l’ensemble originale est
recherché, le problème de dimensionnalité peut souvent être résolu via la construction de données.
Le processus de construction des sous-ensembles détermine un nouvel ensemble de variables en
combinant plusieurs indicateurs de défauts existantes dans l’espoir que leur combinaison améliore la
distinction entre les classes par rapport à l’espace de l’ensemble d’origine [127].

Figure 2. 7 La procédure du modèle Wrapper [128]

Les méthodes Relief et Khi-carré furent précédemment utilisées dans le cadre des machines
tournantes, c’est pourquoi nous les détaillons ici.

48
Méthode Relief

Dans l’article [128], les auteurs ont proposé l’algorithme initial Relief basé sur l’apprentissage par
instance comme méthode de sélection des indicateurs de défauts par filtrage. Le principe de cette
méthode est de calculer une mesure générale de la pertinence des indicateurs de défauts en
accumulant la différence de distance séparant des exemples d’apprentissage choisis au hasard de leurs
voisins les plus proches dans la même classe et dans l’autre classe. Les algorithmes basés sur Relief
maintiennent les avantages généralisés des algorithmes de filtrage, ils sont comparativement plus
rapides que les autres méthodes, avec une complexité temporelle asymptotique. L’algorithme 2.1
représente le pseudo code de la méthode Relief. Cette méthode est déjà utilisée dans le cadre de
diagnostic de défaut de roulement à l’aide de méthodes de classement des fonctionnalités et
d’algorithmes d’identification de défaut par [119].

Algorithme 2. 1 pseudocode de sélection de Relief [128]


Entrées : une base d’apprentissage A=[x1 , x2 , … . , xM ] ou chaque exemple xi =[xi1 , xi2 , … . , xiN ]
Nombre d’itération T
Sorties : W=[N]: vecteur de poids des indicateurs (fi ),-1≤ W=[i] ≤ ꓯi, W=[i] = 0
Pour t=1 à T faire
Choisir aléatoirement un exemple xk
Chercher deux plus proches voisins (un dans sa classe (xa ) et un deuxième dans l’autre classe (xb ))
Pour i=1 à N Faire
|xki −xbi | |xki −xai |
W=[i] = W[i] + -
𝐌∗𝐓 𝐌∗𝐓
Fin Pour
Fin Pour
Retourner W

Khi-carré

Le concept de "test du Khi carré", aussi appelé test x 2 , fait référence à différents types de tests
statistiques d’hypothèse qu’il est possible de réaliser lorsque la statistique du test est le Khi carré
distribué sous la condition de l’hypothèse nulle. Dans les applications standard de ce test, les données
observées sont classées dans des catégories qui ne sont pas compatibles entre elles. Si l’hypothèse
dite nulle est vérifiée, la variable de test calculée à partir des données d’observation suit une
distribution x 2 . L’objectif du test est d’évaluer la probabilité que les fréquences observées supposent
que l’hypothèse nulle est vraie.

Le test du Khi carré est un test statique qui permet de déterminer la concordance d’un ensemble de
données obtenues avec une distribution théorique. Dans le test du Khi carré, les données acquises sont
réparties en ensembles incompatibles entre eux ; le nombre d’occurrences dans un ensemble donné
est la fréquence enregistrée dans l’ensemble. Pour une répartition théorique, cette fréquence est
déterminée et considérée comme la valeur attendue de la fréquence des ensembles. Les statistiques
qui mesurent la différence entre les ensembles et la fréquence d’ensemble prévue, qui permet en fait
de mesurer la proximité de la distribution estimée des biens acquis à la distribution théorique, est
désignée sous le nom de statistiques de Khi carré. Cette méthode est utilisée dans de classement
d’indicateurs pour l’estimation de la gravité des défauts des roulements des machines tournantes
[129].
N
(oi −Ei )2
x2 = ∑
i=1 Ei (2.1)

49
Les statistiques du Khi carré, x 2 , oi est la iéme fréquence observée de l’ensemble, Ei est la
iéme fréquence de groupe attendue du l’ensemble et i le nombre total de groupes considérés.

Réduction de dimension

Parfois, la plupart des indicateurs sont corrélés et donc redondants. C’est là que les algorithmes de
réduction de dimensionnalité entrent en jeu. La réduction de la dimensionnalité est le processus de
réduction du nombre de variables aléatoires considérées, en obtenant un ensemble de variables
principales.

Après avoir extrait les indicateurs et avec de grandes quantités de données, l’importance de la
réduction devient évidente, car elle permet de réduire le temps et l’espace de stockage nécessaires
sans perdre de précieuses informations. Elle facilite également la visualisation des données lorsqu’elles
sont réduites à de très petites dimensions, comme en 2D ou en 3D.

Il existe deux méthodes de réduction de dimension, les méthodes linéaires et les méthodes non
linéaires et dans chaque méthode, il y a des méthodes supervisées et non supervisées.

Pour les méthodes supervisées, on peut citer la méthode LDA [130], les méthodes SVD (Singular Value
Decomposition) [131], et ACP (Analyse en composantes principales) [132] ainsi que leurs variantes en
méthodes non supervisées. Les méthodes ACP et LPP [133] sont des méthodes de réduction de
dimension linéaires tandis que les méthodes KPCA [134]et t-SNE [135] sont des méthodes non
linéaires.

Réduction de dimension linéaire

Les méthodes de réduction de dimensionnalité les plus courantes et les plus connues sont celles qui
appliquent des transformations linéaires qui est une technique non supervisée utilisée pour réduire
un grand nombre de variables en moins de facteurs. Et l’analyse en composantes principales (ACP) non
supervisée est une procédure statistique transformant les n dimensions numériques d’un ensemble
de données en un nouvel sous-ensemble de p dimensions appelées composantes principales, sachant
que p << n. Par exemple, LDA (Linear Discriminant Analysis) est une technique supervisée qui projette
les données de manière à maximiser la séparabilité des classes.

L’analyse en composantes principales (ACP) [136] appartient au groupe des méthodes descriptives
multidimensionnelles dénommées méthodes factorielles.

Algorithme 2. 2 architecture de ACP à l’aide de la méthode de matrice de covariance [138].


Avec une matrice de données (M=[x1 , x2 , … . , xN ])
Où N représente le nombre total d’échantillons, et xi représente le iième échantillon.
1
Calculer la moyenne de tous les échantillons: µ = ∑N i=1 x i .
N
1
Déduire la moyenne de tous les échantillons P: D=[{d1 , d2 , … . , dN }] = ∑N
i=1 x i .- µ.
N
1
Calculer la matrice de covariance: ∑ = D. DT .
N−1
Calculer les vecteurs propres V et les valeurs propres de la matrice λ de covariance (∑).
Les vecteurs propres sont triés en fonction de leurs valeurs propres correspondantes.
Sélectionner les vecteurs propres qui ont les plus grandes valeurs propres
W = {v1 , v2 , … . , vN }, Les vecteurs propres sélectionnés (W) représentent l’espace de projection de l'ACP.
Tous les échantillons sont projetés sur l’espace dimensionnel inférieur de l’ACP (W), Y=W T . D.

L’ACP consiste à trouver des espaces de dimensions plus petites dans lesquels les individus peuvent
être observés au mieux. Son approche essentielle consiste à transformer les variables quantitatives

50
initiales, lesquelles sont plus ou moins corrélées entre elles, en des variables quantitatives non
corrélées, qui sont des combinaisons linéaires des variables initiales et appelées composantes
principales. Les composantes principales sont donc des nouvelles variables indépendantes, des
combinaisons linéaires des variables initiales, avec une variance maximale. De manière générale, l’ACP
comprend la recherche de la direction dans laquelle le nuage de points d’observation est étiré au
maximum. La première composante principale correspond à cette direction. La deuxième composante
principale est déterminée de telle sorte qu’elle soit aussi indépendante que possible de la première et
donc perpendiculaire à celle-ci. Les deux composantes constituent le premier plan principal. Cette
opération est répétée afin de trouver toutes les composantes principales expliquant la variance
maximale [137].
Réduction de dimension non linéaire

Des méthodes de transformation non linéaires ou des méthodes d’apprentissage multiples donne des
meilleurs résultats même lorsque les données ne se trouvent pas sur un sous-espace linéaire. On
trouve plusieurs méthodes de réduction de dimension non linéaire dans la bibliographie comme la
cartographie des entités isométriques (Isomap) [139]. C’est une technique supervisée qui sert à
projeter les données dans une dimension inférieure tout en préservant la distance la plus courte entre
deux points d’une courbe. Il existe aussi l’inclusion localement linéaire (LLE) [140], technique non
supervisée, qui récupère la structure non linéaire globale des ajustements linéaires. Il faut ajouter
l’algorithme t-SNE, (t-distributed stochastic neighbor embedding) [141] technique non supervisée, qui
calcule la probabilité que des paires de points de données dans l’espace de grande dimension soient
liées, puis choisit une incorporation de faible dimension qui produit une distribution similaire. Enfin,
l’analyse en composantes principales à noyau (Kernel PCA) [142] est une technique non supervisée. Il
s’agit d’une extension de l’ACP en utilisant les techniques des méthodes du noyau.

Analyse en composantes principales à noyau

L’analyse en composantes principales à noyau (ACPK) est une extension de l’analyse en composantes
principales (ACP) faisant intervenir les techniques des méthodes du noyau. En employant un noyau,
les fonctions initialement linéaires de l’ACP sont effectuées dans un environnement de reproduction
du noyau de Hilbert.

Algorithme 2. 3 architecture de l’algorithme Online-KPCA [144]


Entrées : matrice M ∈ ℝn*m
Une fonction du noyau K (x, u) : ℝn * ℝn → ℝ,
̿
Avec des points de données {ut́ ∈ ℝn ∗ 1}m t́=1 pour la génération de la base du noyau, moyenne
̅ ∗1
m
initiale µ1 ∈ ℝ ,
̅ ∗1
Les principales orientations initiales Γ1 ∈ ℝm .
̅ ∗1
Sorties : Les principales orientations qui en résultent Γ ∈ ℝm .
Entrées
Pour t=1,2, 3…faire
T
ht ← [K(xt , v1 ) … K(xt , vm ̅ )] ; Calculer les données du noyau
̅ ∗1
m
ht ∈ ℝ
wt ← Ψ(Z(ht , µt , Γt )); Mettre à jour les poids
ꓥt ← Γt T (ht − µt ) ⊕ (ht − µt )Γt ;
g t (µ) ← wt (ht − µt );
g t (Γ) ← wt (ht − µt ) ⊕ (ht − µt )Γt − Γt . u. 𝒯 ꓥt ; Mise à jour des gradients
1
ηt ← ; µt+1 ← µt - ηt . g t ;
t
Γt+1 ← Γt - ηt . g t ; Mise à jour µ et Γ avec le taux d’apprentissage η.
Fin

51
Dans sa version en temps réel, l’algorithme 2.3 obtient les vecteurs entrants 𝑥𝑡 les uns après les autres,
la sortie yt devant toujours être préparée pour recevoir les vecteurs entrants suivants xt+1 . La
méthode KPCA proposée par [143] offre la possibilité de traitement des données en temps réel. La
méthode proposée par [144] prévoit la possibilité non seulement de traiter les données en temps réel
mais aussi de pouvoir choisir le noyau de projection le plus adapté à chaque vecteur de données
accueilli.

T-distributed stochastic neighbor embedding (t-SNE)

Le T-distributed Stochastic Neighbor Embedding (t-SNE) est une technique de réduction de la


dimensionnalité non linéaire qui convient à la représentation de données en grande dimension dans
des espaces en faible dimension à deux ou trois dimensions. En particulier, elle permet de représenter
chaque élément à haute dimension par un point à deux ou trois dimensions, de manière à ce que les
éléments identiques soient modélisés par des points voisins et que les éléments différents soient
modélisés par des points distants avec une grande probabilité. L’algorithme 2.4 représente le
pseudocode de la méthode t-SNE.
Algorithme 2. 4 t- distribution de probabilité entre points voisins (t-SNE)[145].
Entrées : Avec une matrice de données (M=[x1 , x2 , … . , xN ])
Où N représente le nombre total d'échantillons et xi représente le iième échantillon.
Les paramètres de la fonction de coût : perplexity Perp
Les paramètres d'optimisation : nombre d’itérations T, taux d’apprentissage η, momentum α(t).
Sorties : représentation des données en basses dimensions ϒT ={y1 , y2 , … . , yN }
Entrées:
pi⃓ j +pj ⃓ i
Calculer les affinités par paires pi⃓j avec perplexity Perp avec pij = .
2n
Échantillon de solution initiale ϒ0 = {y1 , y2 , … . , yN }, à partir de Ɲ (0, 104 I).
Pour t=1 à T faire
Calculer les affinités de faible dimension qij .
δC δC
Calculer gradient . avec ϒ(t) =ϒ(t−1) + η .+α(t)( ϒ(t−1) − ϒ(t−2) ).
δϒ δϒ
Fin
Fin

L’algorithme de t-SNE comporte deux étapes essentielles. En premier lieu, t-SNE crée une distribution
de probabilité sur des ensembles d’objets à haute dimension de manière à ce que des éléments
similaires soient choisis avec une grande probabilité, alors que des points différents ont une probabilité
très faible de sélection. Deuxièmement, t-SNE permet de définir une distribution de probabilité
identique sur les points de la zone à faible dimension, et de réduire au minimum la divergence de
Kullback-Leibler (divergence KL) [146] entre ces deux distributions par rapport à la position des points
sur la zone. Le t-SNE a été appliqué à la représentation dans un grand nombre de secteurs. Il est
souvent utilisé pour représenter des données de haut niveau acquises par un réseau neuronal artificiel
[147].

Classification

C’est la phase la plus importante dans le processus de RdF car elle permet de classifier des objets
d’après leurs représentations. Le classifieur prend la décision d’affecter une forme à une catégorie
spécifique selon les règles de décision prédéterminées, puis il peut être mis à jour pendant la
classification. Cette tâche est d’autant plus facile que la représentation des objets dans la phase
réduction de dimensionnalité est pertinente.

52
Dans le diagnostic des machines tournantes, on trouve essentiellement deux types de méthodes de
classification : la méthode de classification par apprentissage supervisé et la méthode de classification
par apprentissage non supervisé

Classification supervisée

Les méthodes de classification qui reposent sur l’utilisation de modèles de formation sont appelées
méthodes de classification supervisée [148][149].

Un algorithme de classification supervisée nécessite un échantillon d’apprentissage pour chaque


classe, c’est-à-dire une collection de base de données connue. La classification est donc basée sur la
proximité d’un point à classer avec chaque échantillon d’apprentissage. Les échantillons de formation
sont représentatifs des classes connues d’intérêt pour l’analyste. Toute méthode de classification
utilise un ensemble d’indicateurs pour caractériser chaque classe, où ces indicateurs doivent être
pertinents pour la tâche à accomplir. Dans la classification supervisée, la construction d’un classifieur
comporte trois phases (figure.2.8) : la phase d’apprentissage, la phase de test et la phase
d’évaluation[150].

 Dans la phase d’apprentissage : l’ensemble d’apprentissage est utilisé pour décider de la façon
dont les indicateurs doivent être pondérés et combinés afin de séparer les différentes classes.
 Dans la phase de test : les poids déterminés dans l’ensemble d’apprentissage sont appliqués à
un ensemble pour calculer l’erreur de classification globale de la solution. Cette erreur est
utilisée pour effectuer un ajustement de certains paramètres.

Apprentissage Test Evaluation

Figure 2. 8 les étapes de classification supervisée

 L’évaluation du modèle : pour l’évaluation de classification on utilise un troisième ensemble


de données, l’ensemble de données de validation, qui n’a été utilisé d’aucune façon dans la
formation du modèle. C’est le seul moyen d’éviter la mise en place d’une tautologie
(Proposition identique) pour les opérations d’apprentissage, test et l’opération d’évaluation.
Une tautologie est une définition en soi. Un modèle évalué de cette manière est dans une
certaine mesure une prédiction qui se réalise d’elle-même. Le modèle ne doit pas être évalué
sur les données utilisées pour le former. L’ensemble de données de validation est soumis au
modèle formé et utilisé pour calculer la précision des prévisions.

Il existe un certain nombre de classifieurs supervisés puissants basés sur les statistiques, qui sont
couramment utilisés pour diverses applications. Certains d’entre eux sont la méthode des k plus
proches voisins (K-NN)[151], la méthode bayésienne naïve [152], la méthode de réseaux de neurones
artificiels[153], la méthode de machines à vecteurs de support (SVM)[154], la méthode de l’arbre de
décision [155].

Méthode de k plus proches voisins (K-NN)

La méthode des k plus proches voisins (K-NN) [156] est une méthode non paramétrique supervisée,
dont l’application ne nécessite aucune hypothèse sur les fonctions de densité probabilistes. Les
performances de ce classifieur, comme avec toute méthode non paramétrique, sont extrêmement

53
sensibles à l’inexactitude ou aux imperfections de l’échantillon d’apprentissage. Le K plus proche
voisins est l’un des algorithmes les plus populaires utilisés depuis longtemps dans la reconnaissance
de formes, l’analyse exploratoire des données et les problèmes d’exploration de données. L’algorithme
2.5 représente le pseudocode pour la classification par KNN.

Algorithme 2. 5 le pseudocode de k plus proches voisins (K-NN)[157].


Classer (X, Y, x), avec X: données d'entraînement, Y: étiquettes de classe de X, 𝑥: échantillon inconnu.
Pour i=1 jusqu’à m faire
Calculer la distance d (Xi, x)
Fin pour
Calculer l'ensemble I contenant des indices pour les k plus petites distances d (Xi, x).
Retourner la majorité de l'étiquette pour {(Yi où i ∈ I). }

Certains avantages de l’algorithme K-NN sont sa simplicité inhérente, sa robustesse aux données
d’entraînement bruitées et aussi sa rapidité à implémenter [158]. Dans l’article [159], une approche
de diagnostic de défaut de roulement basée sur l’entropie de permutation pondérée multi-échelle
(CMWPE), la sélection de indicateurs d’information mutuelle commune (JMI), et le classifieur des k-
voisins les plus proches (KNN) (CMWPE-JMI-KNN) est proposée. Aussi dans [160], les auteurs
proposent une méthode de diagnostic en ligne et en temps réel des défauts des roulements, basée sur
l’algorithme KNN. Dans [161] l’auteur a utilisé une approche basée sur une méthode avancée de
traitement du signal comme la transformée en ondelettes et une technique d’intelligence artificielle
comme le réseau neuronal artificiel (ANN) et K-NN, pour la classification des défauts de roulement.

Méthode bayésienne naïve

En général, l’analyse bayésienne suit de plus près les schémas de la pensée humaine en comparaison
à l’analyse statistique classique, ou même les algorithmes d’apprentissage automatique [162].

La classification est un calcul impliquant des probabilités simples ; pour les Bayésiens, la classification
est un jugement fondé sur la probabilité conditionnelle [163]. Dans de nombreuses situations de
classification impliquant des attributs de données, nous en savons relativement peu sur l’entité que
nous classons, et il peut être acceptable de considérer le processus de classification comme un
jugement. Suivant cette logique, la classification naïve bayésienne est interprétée comme une
technique utile dans de nombreux domaines de l’exploration de données.

Algorithme 2. 6 le pseudocode de la méthode naïve bayésienne[166].


Entrée
Ensemble de données sur la formation T
F= (f1, f2, f3…, fn) // valeur de la variable prédicteur dans l’ensemble de données de test.
Sortie
Une classe de données de test.
Pour Lire l’ensemble des données de formation T
Calculer la moyenne et l’écart-type des variables prédicteurs dans chaque classe
Répéter
Calculer la probabilité de fi en utilisant l’équation de densité de gauss dans chaque classe
Tant que la probabilité de toutes les variables prédicteurs (f 1, f2, f3…, fn) n’a pas été calculée
Calculer la similitude pour chaque classe
Obtenir la plus grande probabilité
Fin

L’article [164], la méthode naïve bayésienne (NB) , est utilisé pour diagnostiquer le défaut du
roulement avec les données à faible corrélation. Une étude comparative des classifieurs de Bayes pour

54
le diagnostic des défauts des pales d’éoliennes par les signaux de vibration est faite par [165].
L’algorithme 2.6 représente le pseudocode de naïve bayésienne.

Réseaux de neurones artificiels

Les réseaux de neurones artificiels (Artificial neural networks, ANN) [167], [168] sont des techniques
de calcul qui appartiennent au domaine de l’apprentissage automatique. L’objectif des réseaux de
neurones artificiels est de réaliser un modèle très simplifié du cerveau humain. La figure 2.9 représente
la structure d’un neurone artificiel.

Figure 2. 9 Structure d’un neurone artificiel. Le neurone calcule la somme de ses entrées puis cette valeur
passe par la fonction d’activation pour produire sa sortie [169]

Les réseaux neuronaux sont appliqués au diagnostic des défauts des machines tournantes. Les réseaux
de neurones ont une capacité éprouvée dans le domaine de la classification des motifs non linéaires.
Après avoir été formés, ils contiennent des connaissances d’experts et peuvent identifier correctement
les différentes causes de vibration des roulements [170]. La capacité des réseaux de neurones
artificiels à compléter et à automatiser l’expertise humaine est ce qui les rend parfaitement adaptés à
la manipulation de systèmes non linéaires. Les réseaux de neurones peuvent acquérir des
connaissances d’experts en étant formés à l’aide d’un ensemble représentatif de données [171]. Une
procédure est présentée par l’article [172] pour le diagnostic des défauts des roulements des éléments
roulants par le biais du réseau neuronal artificiel (ANN). L’étude [173] est basée sur une méthode
avancée de traitement du signal comme la transformée en ondelettes et une technique d’intelligence
artificielle comme le réseau neuronal artificiel (ANN) et le voisin le plus proche (KNN), pour la
classification des défauts de roulement.

Machines à vecteurs de support (SVM)

La machine à vecteurs de support (SVM) est un type d’algorithme d’apprentissage approfondi qui
permet d’effectuer un apprentissage supervisé pour la classification ou la régression de groupes de
données. Dans l’IA et l’apprentissage machine, les systèmes d’apprentissage supervisé fournissent à la
fois des données d’entrée et de sortie souhaitées, qui sont étiquetées pour la classification [174]. Cette
classification fournit une base d’apprentissage pour le traitement futur des données. Les machines à
vecteurs de support sont utilisées pour trier deux groupes de données selon une classification similaire.
Les algorithmes tracent des lignes (hyperplans) pour séparer les groupes selon des modèles. Par ces
fonctions, les SVM sont appelés un classifieur linéaire binaire non probabiliste.

Cette méthode a été appliquée avec succès dans le domaine de l’approximation des fonctions, de la
reconnaissance de formes, de l’analyse de régression et du traitement du signal [175]. C’est une

55
nouvelle application intelligente récemment développée pour résoudre les problèmes d’apprentissage
automatique en utilisant un petit nombre d’échantillons. Il peut traiter des problèmes pratiques non
linéaires avec de petites tailles d’échantillons de données et une dimensionnalité élevée [176].
L’algorithme 2.7 représente le pseudocode pour la procédure de la classification par SVM.

Algorithme 2. 7 Le pseudocode de SVM [177]


Entrée : Ensemble de données D
Résultat : Matrice de confusion, Validation
Apprentissage  partitionner [ 0.7 de la matrice de taille D]
Test  partitionner [ 0.3 de la matrice de taille D]
SVM MultiClassOne. Apprentissage (saisie sous forme d’ensemble de données distribuées résilientes, numéro
d’itérations, taille de pas, paramètre enregistré) :
X : Nombre d’échantillons
Y : Étiquettes, où Yi ∈ {1, ..., N}
M : Modèle de classifieur SVM Stochastic gradient descente
Pour chaque n dans {1, ..., N}
Construire un nouvel échantillon de vecteur γ où γi=1 si yi=k et γi=0
Sinon Appliquer M à X, γ pour obtenir la liste des classifieurs
Testez le modèle en utilisant "Test"
Calculer les Scores
Calculer la Matrice de confusion
Valider le Modèle

Comme d’autres machines d’apprentissage supervisé, un SVM nécessite des données étiquetées pour
être formé. Les algorithmes essaieront d’obtenir la meilleure séparation des données en maximisant
la frontière autour de l’hyperplan et même entre les deux côtés [178]. La figure 2.10 représente un
hyperplan à marge maximale et une marge pour un SVM formé sur deux classes.

Figure 2. 10 Exemple d’hyperplan pour un SVM formé sur deux classes[179]

Les auteurs dans [180] ont utilisé la méthode SVM pour diagnostiquer les défauts de roulement et ont
obtenu de meilleurs résultats par rapport à d’autres approches. Dans l’article [181] les auteurs ont
proposé un schéma de détection de défaut de roulement pour un moteur à induction triphasé qui
combinait des transformées en ondelettes continues et des SVM. Dans [182] les auteurs représentent
une étude de diagnostic des défauts de roulement à billes à l’aide d’une machine à vecteur de support
basée sur l’algorithme artificiel de fish-swarm.

Arbre de décision

Un arbre de décision est une opération qui divise un ensemble de données en un certain nombre de
segments de type branche. L’arbre de décision fait partie des algorithmes les plus populaires parmi les
algorithmes de classification. Les arbres de classification et de régression (CART) sont un autre
algorithme d’apprentissage machine assez ancien [183].

56
La classification se fait à travers un arbre de décision dont les feuilles représentent les différentes
conditions des roulements. Le processus de branchement séquentiel aboutissant aux feuilles ici est basé
sur des probabilités conditionnelles associées à des indicateurs individuels.

Figure 2. 11 Diagnostic des défauts de roulements par arbre de décision [184]

La figure 2.11 montre clairement que le nœud supérieur est le meilleur nœud pour la classification. Les
autres indicateurs apparaissent dans les nœuds de l’arbre de décision par ordre décroissant
d’importance. Il convient de souligner ici que seuls les indicateurs qui contribuent à la classification
apparaissent dans l’arbre de décision et que les autres n’y figurent pas. Le niveau de contribution n’est
pas le même et les huit indicateurs n’ont pas toutes la même importance [185]. Le niveau de
contribution par caractéristique individuelle est donné par une mesure statistique entre parenthèses
dans l’arbre de décision. Les performances du moteur d’inférence floue ont été jugées encourageantes.
En général, la sélection des indicateurs et la génération de règles peuvent être effectuées dans
n’importe quel domaine à l’aide d’un arbre de décision [186].

Cette méthode est appliquée dans le domaine de détection des défauts dans les roulements par [187].
L’article utilise des signaux acoustiques acquis dans le roulement, dans le but de diagnostiquer des
défauts par une approche d’apprentissage machine. Les indicateurs statistiques descriptifs ont été
extraits des signaux sonores et les plus importants ont été sélectionnés à l’aide d’un arbre de décision
(réduction de la dimensionnalité), ensuite les indicateurs réduits été utilisés pour la classification à
l’aide de l’algorithme de l’arbre de décision C4.5. [188] présente l’utilisation de l’arbre de décision pour
générer automatiquement les règles à partir de l’ensemble des indicateurs. Pour cela, des signaux
vibratoires ont été enregistrés les conditions suivantes : bon roulement, roulement avec défaut de la
bague intérieure, roulement avec défaut de la bague extérieure, et défaut des bagues intérieure et
extérieure. Dans [189] pour le diagnostic les défauts dans les boîtes d’engrenage, l’auteur a utilisé la
décomposition en ondelettes discrètes pour l’extraction de indicateurs et l’arbre de décision pour la
classification.

Classification non supervisée

L’analyse en classe également connue sous le nom d’apprentissage non supervisé est utilisée dans les
statistiques multivariées pour découvrir des classes latentes suspectes dans les données ou pour
découvrir des groupes d’observations homogènes. Elle consiste à apprendre sans superviseur. Il s’agit
d’extraire des classes ou groupes d’individus présentant des indicateurs communs. La qualité d’une
méthode de classification est mesurée par sa capacité à découvrir certains ou tous les motifs cachés.
Une méthode d’apprentissage non supervisée est une méthode dans laquelle nous tirons des

57
références à partir d’ensembles de données constituées de données d’entrée sans réponses
étiquetées. Généralement, il est utilisé comme un processus pour trouver une structure significative,
des processus sous-jacents explicatifs, des indicateurs génératifs et des regroupements inhérents à un
ensemble d’exemples.

Le regroupement est très important car il détermine le groupement intrinsèque parmi les données non
étiquetées présentes. Il n’y a aucun critère pour une bonne classification. Cela dépend de l’utilisateur
et des critères utilisés par l’utilisateur [190].

Le choix des types d’entités et des niveaux de mesure dépend du type de données. Pour cette raison,
de nombreuses méthodes de classification ont été développées. Selon les stratégies de classe, ces
méthodes peuvent être classées en trois catégories : hiérarchique [191], partitionnement [192],et
densité [193]. Les algorithmes connus sous la catégorie hiérarchique sont CURE [194], et CHEMELEON
[195]. Les algorithmes hiérarchiques ont construit une structure en forme d’arbre, appelée
dendrogramme, pour révéler une structure en classe à chaque itération. Les techniques sous la
catégorie des partitionnements sont les PAM [196], CLARA [197], et CLARANS [198]. Ces méthodes
regroupent les données en k classes où la valeur de k est fournie par l’utilisateur. Des techniques
basées sur la densité ont été introduites pour déterminer la classe de forme arbitraire dans les bases
de données spatiales ayant du bruit. Le DBSCAN [199], DENCLUE [200] et OPTICS [201] sont les
techniques le plus couramment utilisée.

2.6.2.1. Méthodes de partitionnement

La classification partielle (ou classification de partitionnement) est une méthode utilisée pour classer
les observations, au sein d’un ensemble de données, en plusieurs classes en fonction de leur similitude.
Les algorithmes nécessitent que l’analyste spécifie le nombre de classes à générer[202].

Ces méthodes partitionnent les objets en K-classes et chaque partition forme une classe. Cette
méthode est utilisée pour optimiser une fonction de similarité de critère objectif, comme lorsque la
distance est un paramètre majeur.

Principe de la méthode de partition : Étant donné une base de données de n objets, la méthode
construit K-partitions des données. Chaque objet doit appartenir à exactement une classe. Chaque
classe doit contenir au moins un objet. La technique de partition peut améliorer la technique de
relocalisation itérative en explorant des objets d’un graphique à un autre. L’objectif principal de
l’algorithme de classification par partition est de diviser les points de données en K-partitions. Chaque
partition reflétera une classe. La faiblesse d’un tel algorithme est que chaque fois que la distance entre
les deux points du centre est proche d’une autre classe, le résultat devient médiocre ou trompeur en
raison du chevauchement des points de données.

L’algorithme le plus connu pour les méthodes de partition est celui de K-means, qui été déjà utilisé
pour surveiller les machines tournantes [204], il s’agit d’une méthode de classification de modèle non
supervisée, pouvant ainsi être appliquée directement aux environnements industriels sans avoir
besoin d’être formé par des données mesurées sur une machine sous une condition de défaut.
D’autres avantages de la méthode sont sa facilité de programmation et la réalisation d’un bon
compromis entre les performances obtenues et la complexité de calcul. L’algorithme 2.8 pseudocode
de la classification par partition (K-means).

58
Algorithme 2. 8 pseudocode de la classification par partition K-means [203].
Étape 1 : Accepter le nombre de classes dans lesquels les données doivent être classées et le l’ensemble de
données à classer comme valeurs d’entrée
Étape 2 : Initialiser les premiers classes K
Prenez les premières K instances ou prendre un échantillon aléatoire de K éléments
Étape 3 : Calculer les moyennes arithmétiques de chaque classe formée en l’ensemble des données.
Étape 4 : K-means attribue chaque enregistrement de l’ensemble de données à une seule classe
Chaque enregistrement est affecté au classe le plus proche à l’aide d’une mesure de la distance
(par exemple, la distance euclidienne).
Étape 5 : K-means réattribue à chaque enregistrement de l’ensemble de données la classe plus similaire et
recalcule la moyenne arithmétique de tous les classes de l’ensemble de données.
2.6.2.2. Méthodes basées sur la hiérarchie

Les classes identifiées dans cette méthode forment une structure de type arborescence basée sur la
hiérarchie. De nouvelles classes sont formées en utilisant celles qui ont été précédemment identifiées.
Ce processus de classification est représenté sous la forme d’un dendrogramme. Il peut être analysé à
l’aide d’une méthode statistique. La méthode hiérarchique implique la création de classes qui ont un
ordre prédéterminé de haut en bas. Ils sont appelés hiérarchiques en raison de la structure qu’ils
représentent sur l’ensemble des données. Il existe deux types de classification hiérarchique : diviseur
et agglomératif [205]. La figure 2.12 représente la classification hiérarchique ascendante. L’algorithme
2.9 Introduit un pseudocode général des méthodes hiérarchiques.

Figure 2. 12 Dendrogramme de la classification hiérarchique ascendante [206]

Algorithme 2. 9 pseudocode générale des méthodes hiérarchiques[207]


1. Transformer chaque élément d’entrée en un élément unique, c’est-à-dire en une classe d’un seul élément.
2. Pour chaque paire de classes C1, C2 calculer leur distance d (C1, C2).
3. Fusionner les paires de classes qui prennent la plus petite distance.
4. Continuer l’étape 2, jusqu’à ce que le critère de terminaison soit satisfait.
5. Le critère de terminaison le plus couramment utilisé est un seuil de la valeur de la distance
2.6.2.2.1. Méthode de division

Dans la méthode de classification par division ou descendante, il consiste à attribuer toutes les
observations à une seule classe, puis partitionner la classe en deux classes moins similaires. Enfin, on
procède récursivement sur chaque classe jusqu’à ce qu’il y ait une classe pour chaque observation. Il
est prouvé que les algorithmes de division produisent des hiérarchies plus précises que les algorithmes
d’agglomération dans certaines circonstances, mais sont conceptuellement plus complexes. Tous les
points de données sont considérés comme une seul classe et répartis en nombre de classes en fonction
de certains critères. L’analyse des divisions (DIANA) est utilisée dans l’article [208] pour classifier les
données.

59
2.6.2.2.2. Méthode agglomérative

Dans la méthode d’agrégation agglomérative ou ascendante, chaque observation classer selon sa


propre classe. Ensuite, la similitude calculer (par exemple, la distance) entre chacune des classes et on
joint les deux classes les plus similaires [209].

Des méthodes hiérarchiques sont utilisées pour diagnostiquer les machines tournantes comme dans
[207]. Une nouvelle méthode de diagnostic de panne nommée réseau profond hiérarchique basée sur
LSTM (long short-term memory) est proposée pour les deux fonctions d’apprentissage et de
reconnaissance des défauts des roulements [208]. Les algorithmes d’arbre de décision avec les
indicateurs de défauts statistiques du signal de vibration amélioreront le diagnostic des défauts des
roulements à rouleaux [209].

2.6.2.3. Méthodes basées sur la densité

L’approche de classification basée sur la densité est une méthodologie qui est capable de trouver des
classes de forme arbitraire, où les classes sont définies comme des régions denses séparées par des
régions de faible densité. Un algorithme basé sur la densité n’a besoin que d’une seule analyse de
l’ensemble de données d’origine et peut gérer le bruit. Le nombre de classes n’est pas requis, car les
algorithmes de classification basés sur la densité peuvent détecter automatiquement les classes, ainsi
que le nombre naturel de classes [210].

Ces méthodes considèrent les classes comme une région dense ayant une certaine similitude et
différente de la région de faible densité inférieure. Ces méthodes offrent une bonne précision et la
capacité de fusionner deux classes, par exemple DBSCAN (density-based spatial clustering of
applications with noise)[211], OPTICS (ordering points to identify the clustering structure)[201], etc.

2.6.2.3.1. Algorithme DBSCAN

DBSCAN (Density-based spatial clustering of applications with noise) [212] est une méthode de
classification basée sur la densité. L’algorithme DBSCAN utilise deux paramètres : la distance () et le
nombre minimum de points 𝑀𝑖𝑛𝑃𝑡𝑠 qui doivent se trouver dans un rayon de () pour que ces points
soient considérés comme une classe. Les paramètres d’entrée sont donc une estimation de la densité
des points de la classe. L’idée de base de l’algorithme est alors, pour un point donné, de récupérer son
() voisinage et de vérifier qu’il contient des 𝑀𝑖𝑛𝑃𝑡𝑠 ou non. Ce point est alors considéré comme
faisant partie d’une classe. Ensuite continuer le processus jusqu’à (  ) voisinage successivement d’un
point à un autre pour identifier tous les points de la classe.

Dans la classification DBSCAN, il est nécessaire d’introduire certaines définitions :

 Le voisinage  d’un point p dans une base D est note par  (p) est definie par :

 (P)=q ∈ D|distance(p, q) ≤ |
1 si dist(p, q) ≤ 
Np(q)={
0 sinon
Np(q) est le degré d’appartenance de point q a l’ensemble des points au voisinage de p.

 L’accessibilité par densité est la notion de base de DBSCAN. Un point p est accessible par
densité de q si deux conditions sont satisfaites :
p ∈  (P)
|(p) |  P) ≥ 𝑀𝑖𝑛𝑃𝑡𝑠

60
L’algorithme DBSCAN a pour objectif d’identifier les partitions et le bruit dans une base de données.
Idéalement, il serait nécessaire de connaître les paramètres  et 𝑀𝑖𝑛𝑃𝑡𝑠 appropriés de chaque classe
et un point de chacune des classes respectives[213].

DBSCAN a de nombreux avantages par rapport à d’autres méthodes de classification. Tout d’abord, il
ne nécessite pas de prédéfinir le nombre de classes. DBSCAN peut automatiquement classifier
l’ensemble de données en classes sans lui indiquer le nombre de classes dans l’ensemble de données.
Le nombre de classes change tout au long du processus de mise en classes jusqu’à ce que DBSCAN
trouve la dernière classe. Un autre avantage évident de DBSCAN est qu’il peut détecter les valeurs
aberrantes. Il s’avère que cet avantage n’est qu’un effet secondaire du processus de mise en classes,
qui n’apporte pas de calcul supplémentaire complexe comme le font certaines autres méthodes de
mise en classes. Un autre mérite de DBSCAN est qu’il peut classifier les données sous des formes
arbitraires. Ainsi il détecte automatiquement le nombre de classes et trouve des classes de tailles et
de formes différentes, il peut être utilisé pour identifier des modèles d’utilisation normale. Les petites
classes représentent alors des modèles peu fréquents, et les très petites classes ou les valeurs
aberrantes peuvent représenter des anomalies. DBSCAN présente de nombreux avantages, mais il a
aussi des faiblesses. Par exemple, pour des données de densités variables, il est difficile pour DBSCAN
de trouver la bonne classe et cela représente un défi de mettre en place les bons paramètres de
modèle [214].

2.6.2.3.2. Algorithme OPTICS

OPTICS (ordering points to identify the clustering structure), est un algorithme de classification
hiérarchique qui repose sur une notion de densité de classes proposée par [201]. C’est une extension
DBSCAN. Elle corrige l’une des principales faiblesses de DBSCAN qui est le problème de la découverte
des classes dans des données à densité variable. L’algorithme OPTICS nécessite deux paramètres, le
nombre minimum de points (𝑀𝑖𝑛𝑃𝑡𝑠) qui contient dans son ε-voisinage, et  est le rayon maximum
du voisinage. Ces deux paramètres définissent donc une densité minimale pour constituer une classe.
Il est capable de découvrir des classes importantes dans les données de densité variable en produisant
une disposition par ordre de points, de sorte que les points qui sont spatialement les plus proches,
deviennent voisins dans l’ordre. OPTICS commence par ajouter un point arbitraire d’une classe à la
liste des commandes, puis étend la classe de façon itérative répétée en ajoutant un point situé au ε-
voisinage du point de la classe, qui est également le plus proche des points déjà définis. Le processus
se poursuit jusqu’à ce que la classe entière soit ajoutée à l’arrangement. Le processus passe ensuite
aux classes restantes. De plus, OPTICS calcule la distance d’accès pour chaque point. Cela représente
la densité requise pour contenir deux points dans la même classe.
L’idée clé de clustering basée sur la densité est que pour chaque objet, le voisinage d’un rayon (  ) doit
contenir au moins un nombre minimum de points et la cardinalité de la zone voisinant doit dépasser
un certain seuil. Les définitions formelles pour cette notion de clustering sont brièvement introduites
dans la suite.
L’algorithme OPTICS crée un ordre de la base de données. En outre, il enregistre les deux grandeurs:
le distance-noyau et la distance-accessibilité pour chaque objet. Cette information peut aider à
extraire toutes les zones les plus denses:

 Définition 1: directement densité-accessible


L’objet p est directement densité-accessible à partir de l’objet q à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans un
ensemble d’objets si:

61
1- p ∈ Nε (q), avec Nε (q) est le sous ensemble de D contenu dans le voisinage de q.
2- card(Nε (q)) ≥ MinPts, card(Nε (q)) désigne le cardinal de l’élément N.
La condition card ( N (q))  MinPts est appelée "condition de distance-noyau". Si cette
condition est valable pour un objet p, cet objet s’appellera objet noyau. Seulement à partir de cet
objet, d’autres objets peuvent être directement densité-accessible.

 Définition 2: densité-accessible
Un objet p est densité-accessible à partir de l’objet q à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans l’ensemble des
objets D s’il y a une chaine d’objets p1 …, pn avec p1 =q, pn = p tel que pi =D et pi+1 est directement
densité-accessible à partir de pi ,  et MinPts.

Cette relation n’est en général pas symétrique. Seuls les objets de bases peuvent être
mutuellement densité-accessible.

 Définition 3. : Densité-connecté
L’objet p est densité-connecté à l’objet q à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans l’ensemble d’objets D si il y a
un objet O ∈ D tel que p et q sont densité-accessible depuis O à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans D.

La densité-connecté est une relation symétrique. Notez que les définitions ci-dessus exigent seulement
une mesure de distance et sera également applicable aux données à partir d’un espace métrique. Un
cluster basé sur la densité est désormais défini comme un ensemble d’objets de densité-connecté, qui
est maximale à partir de densité-accessible. Un point est considéré comme bruit s’il n’appartient à
aucun cluster.

 Définition 4: (cluster et bruit)


Soit un ensemble d’objets D. Un cluster C à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans D est un sous-ensembles non
vide de D satisfaisant aux conditions suivantes:
Maximalité: ∀ p, q ∈ D si p ∈ C et q est densité-accessible de q à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 , alors aussi q ∈C.
Connectivité: ∀ p, q ∈ D est densité-connecté à q à partir de  et 𝑀𝑖𝑛𝑃𝑡𝑠 dans D.

Chaque objet qui n’appartient à aucun cluster est un bruit. Notez qu’un cluster contient non seulement
des objets de base mais aussi des objets qui ne remplissent pas la condition de l’objet-noyau. Ces
objets appelés objets de bordure du cluster sont, cependant, directement densité accessible depuis au
moins un objet de base de la classe (contrairement aux objets bruit).

 Définition 5: distance-noyau
P est un individu de l’ensemble de données D,  est la valeur de la distance de voisinage, N  ( p) est le
ɛ-voisinage de p, 𝑀𝑖𝑛𝑃𝑡𝑠 est le nombre minimal de points dans le  -voisinage de p et 𝑀𝑖𝑛𝑃𝑡𝑠 -
distance(p) est la distance de p à son 𝑀𝑖𝑛𝑃𝑡𝑠 voisinage, le distance-noyau de p est défini comme :

si card (Nε(p)) < 𝑀𝑖𝑛𝑃𝑡𝑠, Indéfini (2.2)


distance − noyau ԑ,MinPts(p) = {
autre, MinPts − distance(p)

Le distance-noyau de l’objet p est simplement la plus petite distance ԑ' entre p et l’objet en son
voisinage tel que p soit un distance-noyau à partir de ԑ'si ce voisin est contenu dans Nε(p). Autrement
le distance-noyau est indéfini.

62
si Nε(o) < 𝑀𝑖𝑛𝑃𝑡𝑠, Indéfini
distance − accessiblé ԑ,MinPts(p,o) {
max(distance − noyau(o) ; distance − noyau(p) ) (2.3)

Il est évident que la distance accessibilité de l’objet p par rapport à un autre objet o est la plus petite
distance telle que p est la densité accessible directement depuis o si o est un objet-noyau. Dans ce cas,
la distance- d’accessibilité ne peut être qu’après la distance-noyau de o, car pour des distances plus
petites, la densité accessible ne peut être atteinte directement à partir de l’objet d’aucun objet o.
Autrement si on n’a pas un objet-noyau, même à la distance d’une génération ε, la distance-
d’accessibilité de p à partir de o est indéfinie. La distance- d’accessibilité à l’objet p dépend de l’objet-
noyau, par rapport à son calcul. Bref, la distance-noyau et la distance-d ’accessibilité ne sont pas
définies si l’ensemble de points n’est pas suffisamment dense. La figure 2.13 ci-dessous représente la
distance- noyau, et la distance-d ‘accessibilité.

a b
Figure 2. 13 (a) Représentation de la distance-noyau 𝑪𝒅 , de la distance d'accessibilité, 𝑹𝒅 pour 𝑴𝒊𝒏𝑷𝒕𝒔
=4. (b) Extraction de deux clusters par le diagramme « Reachability plot ».

2.6.2.4. Classification déterministe et stochastique

Un modèle déterministe est un modèle qui utilise des nombres comme entrées et produit des nombres
comme sorties. Un modèle stochastique comprend une composante aléatoire qui utilise une
distribution comme l’une des entrées et entraîne une distribution pour la sortie. Les algorithmes
stochastiques ont des inconvénients en terme d’imprécision, et très gourmands en ressources
processeurs s’il y a un nombre important de contributeurs à l’incertitude de sortie[1].

2.6.2.5. Classification incrémentale et non-incrémentale

Les méthodes non-incrémentales sont celles qui doivent traiter toutes les observations à chaque
itération d’une procédure itérative pour affiner une solution finale. De toute évidence, les méthodes
incrémentales sont généralement beaucoup plus rapides que les non-incrémentales, et pour des
ensembles de données extrêmement volumineux, les non-incrémentales peuvent ne pas être
applicables du tout (sans premier sous-échantillonnage)[108].

2.6.2.6. Hard and Fuzzy (Dure et floue)

Les méthodes dures prennent une décision finale sur la classe et relient chaque objet à une classe
unique, tandis que la méthode floue relie chaque objet avec un degré d’appartenance à chaque classe
[215]. L’estimation de la zone par la méthode dure peut produire de grandes erreurs, en particulier à
partir de données de résolution spatiale grossière [216]. La plupart des classifieurs, tels que la
probabilité maximale, la distance minimale, le réseau neuronal artificiel et la machine à vecteurs de

63
support sont essentiellement des méthode dures. [217] propose une nouvelle méthode de
reconnaissance des défauts de roulements basée sur les réseaux neuronaux à classification floue
profonde (DFCNN).

Les méthodes floues fournissent pour chaque objet une mesure du degré de similitude pour chaque
classe, elles délivrent plus d’informations et potentiellement un résultat plus précis, en particulier pour
la classification des données de résolution spatiale grossière. Les réseaux de neurones artificiels, la
logique floue, l’arbre de décision et les algorithmes génétiques relèvent des techniques de
classification floue [218]. [219] présente une nouvelle approche pour le diagnostic des défauts
mécaniques basée sur l’analyse du domaine temporel et le regroupement adaptatif dès la C–Means
floues.

2.6.2.7. La métrique

Le critère métrique joue un rôle dans la classification des objets : c’est pourquoi nous choisirons la
distance ou la dissimilarité comme critère métrique entre deux objets, nous permettant de déterminer
dans quelle mesure les deux objets sont similaires, ou vice versa. Les métriques nous aident à
comprendre comment fonctionne un classifieur; beaucoup sont disponibles, certains sont avec de
nombreux paramètres réglables. La compréhension des métriques est également essentielle pour
évaluer les rapports entre les classes. Le tableau 2.1 représente les différents types de distance.

Tableau 2. 1 Avantages et inconvénients des différentes distances utilisées. x et y sont des vecteurs de
indicateurs.
Distance Formule commentaires
1
Euclidean 2
1) Convient aux ensembles de données avec des classes séparées [220].
(∑(𝑥𝑖 − 𝑦𝑖 ) )2 Avantage
2) Rapide pour les petites données
1) Sensible aux valeurs aberrantes [220].
Désavantage 2) Résultats fortement influencés par les variables [221].
3) Défaillance dans la classification de données massives.
1
Mahalanobis 1) Convient aux données corrélées.
((x − 𝑦)′ C −1 (𝑥 − 𝑦))2
2) Permet de déterminer des frontières courbes et linéaires.
C , est la matrice de Avantage 3) La distance est une distorsion causée par une combinaison linéaire d’attributs.
covariance. 4) Tient compte la forme des classes en employant la corrélation intra-groupe
[222].
1) Quand le bruit a un grand effet, il peut conduire à la couverture des données
fournies et à une mauvaise classification [223].
2) Il n’est pas possible de calculer l’inverse de la matrice de corrélation lorsque
Désavantage
les variables sont fortement corrélées [224].
3) Lorsque la dimension est proportionnelle, les valeurs propres de la covariance
sont égales à zéro, alors la distance ne peut pas être calculée [225].
Cityblock ∑|𝑥𝑖 − 𝑦𝑖 | 1) Présente de meilleures performances avec les ensembles de données en
Or termes de temps de calcul réduit.
Manhattan 2) Facilement généralisable à des dimensions supérieures.
Avantage
3) Avoir une inégalité triangulaire et offrir un meilleur contraste de données que
la distance euclidienne [222].
4) Relativement bon contraste de données dans les dimensions élevées.
Désavantage 1) Sensible aux valeurs aberrantes [226].
1
Minkowski 𝑝 𝑞
1) Utile pour les données de grande dimension [226].
Avantage
Order 𝑞 2) Utile pour les ensembles de données avec des classes compacts ou isolés.
(∑|𝑥𝑖 − 𝑦𝑖 |𝒒 )
Désavantage 1) le mode de calcul est coûteux [227].
𝑖=1
Chebychev 𝑚𝑎𝑥𝑖 (|𝑥𝑖 − 𝑦𝑖 |) 1) Il faut moins de temps pour compter les distances entre les ensembles de
Avantage
données[228].
1) Plus sensible aux échelles de grandeur des indicateurs, la faiblesse inhérente
Désavantage peut être résolue par la normalisation de toutes les indicateurs avant la tâche de
classification [229].

64
Méthodes de classification semi-supervisée

L’apprentissage semi-supervisé est une approche de l’apprentissage automatique qui associe une
petite quantité de données étiquetées à une grande quantité de données non étiquetées pendant la
pratique. L’apprentissage semi-supervisé se situe entre l’apprentissage non supervisé sans données de
formation étiquetées et l’apprentissage supervisé avec seulement des données de formation
étiquetées [230].

Les données non étiquetées, lorsqu’elles sont utilisées en association avec une petite quantité de
données étiquetées, peuvent améliorer significativement la précision de l’apprentissage. Le fait que le
coût associé au processus d’étiquetage puisse rendre impossible l’acquisition de grands ensembles de
formation entièrement étiquetés, alors que l’acquisition de données non étiquetées est
comparativement peu coûteuse. Dans ces situations, l’apprentissage semi-supervisé peut-être d’une
importante pertinence pratique. L’apprentissage semi-supervisé présente également un avantage
théorique pour l’apprentissage machine et comme modèle pour l’apprentissage humain[231].

Cette méthode est déjà utilisée dans le domaine de détection des défauts dans les machines
tournantes. Une méthode de diagnostic incrémental basée sur un apprentissage en groupe semi-
supervisé est proposée, pour traiter les problèmes de label faible avec le respect des prescriptions en
termes de diagnostic. Une méthodologie hybride nouvelle[232], combinée à la fonction graphe de
visibilité (VGF) et à l’apprentissage semi-supervisé du déséquilibre basé sur les graphes (GRSSL), pour
le diagnostic des défauts de roulement dans des conditions variées avec des données non étiquetées
non équilibrées.

65
CONCLUSION
Le chapitre 2 décrit les méthodes de reconnaissances de formes avec leurs spécificités, leurs avantages,
leurs inconvénients. Ces méthodes peuvent posséder un caractère statique et/ou dynamique. La
classification statique des données qui évolue avec le temps ne peut être considérée comme une
représentation globale d’un système réel qui passe d’un état normal à l’état anormale dans le temps.
Les évolutions des classes reflètent un changement au niveau des données, ce qui signifie un
changement dans le système observé. Dans la classification statique, cette évolution temporelle des
données exposées par l’évolution des classes n’est pas prise en compte.

Les classes d’un système évolutif sont nécessairement dynamiques ; leurs caractéristiques évoluent
dans le temps, de manière lente, progressive, ou brutale. L’évolution du comportement des classes est
directement liée à l’état du système à surveiller. En ce qui concerne la surveillance des roulements, le
passage en mode brusque est toujours associé à l’apparition d’un défaut. Autrement dit, les méthodes
de classification appliquées au diagnostic des machines tournantes n’ont pas été totalement
optimisées jusqu’à présent.
Comme nous l’avons vu dans ce chapitre, cette problématique comporte des difficultés très
complexes. Il s’agit notamment des problèmes de classification incrémentale, adaptative et non
supervisée, à laquelle il faut encore ajouter la considération des phénomènes dynamiques associés à
l’évolution des classes. Dans ce cadre, l’objectif consiste à réaliser de manière continue et adaptative
une représentation des classes à partir de données non stationnaires.

Cependant les méthodes de classification dynamique supervisées sont difficiles à utiliser dans le
domaine industriel car on a besoin de connaitre le fonctionnement de la machine en avance.
Cependant dans l’industrie les données sont récoltées en temps réel. Il est préférable d’utiliser les
méthodes de classification dynamique non supervisées dans le domaine industriel car la détection des
défauts en temps réel ne nécessite pas une connaissance préalable de l’état de fonctionnement de la
machine. La littérature concernant les méthodes non supervisées dans le domaine de machines
tournantes n’est pas très présente. En se basant sur la littérature et les travaux mentionnés dans les
chapitres précédents, on peut déduire que pour une surveillance et une détection efficace on a besoin
d’utiliser une méthode de reconnaissance de formes dynamique non supervisée qui peut détecter des
classes de densités différentes, ce qui nous a conduit vers l’algorithme OPTICS combiné avec
l’extraction des indicateurs de défauts dans les trois espaces de représentation (temps, fréquence,
temps-fréquence). Pour atteindre notre objectif, le classifieur dynamique doit avoir des règles
d’apprentissage qui permettent de prendre en compte de nouvelles informations ainsi que l’évolution
des connaissances et des phénomènes dynamiques associés. Dans le chapitre suivant, nous proposons
une méthode de RdF dynamique optimisée et automatisée.

66
CHAPITRE III
CONTRIBUTION A LA MISE EN ŒUVRE DE METHODES DE SURVEILLANCE DES
ROULEMENTS PAR UNE CLASSIFICATION DYNAMIQUE BASEE SUR
L’ALGORITHME OPTICS.

67
INTRODUCTION
En s’appuyant sur les notions de RdF établies dans le chapitre précédent, ce chapitre s’intéresse
particulièrement aux reconnaissances de formes dynamiques permettant la surveillance automatique
des roulements.

Après avoir posé les évolutions récentes sur les différentes méthodes de classification dynamique
supervisées et non supervisées et identifié leurs limites pour le diagnostic du défaut de roulement, ce
chapitre propose deux méthodes de reconnaissance de formes dynamiques. La stratégie principale
s’appuie sur trois étapes majeures. La définition de la " classe saine " correspondant à l’état sain de la
machine à surveiller à partir d’indicateurs représentatifs des états d’endommagements possibles. La
détection d’une nouvelle classe, nommée "classe dégradée" obtenue par projection successives des
individus à chaque nouvelle acquisition. Le suivi de la classe dégradée par le biais des paramètres
géométriques (distance, densité, contour, etc.) permettra de suivre l’évolution du défaut dans les
machines tournantes.

Classification dynamique pour le diagnostic de défaut de


roulement
Dans le domaine de la classification ainsi que dans de nombreux autres domaines, les données
recueillies restent difficiles à traiter en fonction de l’évolution du modèle de connaissance. La figure
3.1 montre l’architecture de la classification dynamique.

Figure 3. 1 Architecture de la classification dynamique

68
Dans la littérature, il existe des méthodes de classification dynamique qui peuvent traiter non
seulement des données dynamiques mais aussi de suivre l’évolution du défaut au cours du temps. Le
développement d’algorithmes pour la classification dynamique constitue une tâche difficile, en raison
de la non-stationnarité des données et de l’évolution des classes. L’architecture utilisée est la même
que dans la méthode de reconnaissance de formes dans le cadre du diagnostic de défaut de roulement,
qui contient les étapes suivantes : acquisition, extraction des indicateurs de défauts, réduction de
dimension, classification, et suivi.

Méthodes non supervisées

L’apprentissage non supervisé est un type d’apprentissage machine qui recherche des modèles non
détectés auparavant dans un ensemble de données sans étiquettes préexistantes et avec un minimum
de supervision humaine.

Détection des défauts de roulements à l’aide de la classification basée


sur la densité [233].

Une méthodologie de détection des défauts basée sur la classification des densités par la méthode
OPTICS est proposée dans [233]. Cette méthodologie suppose que les données des roulements sains
sont situées dans des régions à forte densité et que les données des roulements défectueux sont
situées dans des régions à faible densité. En trouvant les limites de ces régions, qui peuvent être non
convexes, les données des roulements défectueux peuvent être identifiées. La valeur de la densité
pour les roulements sains et les roulements défectueux est évaluée. Le taux de variation de la densité
de sain à défectueux est identifié comme un seuil de défaut. La méthodologie est validée par des
données expérimentales. La figure 3.2 représente la méthodologie appliquée par [233].

Figure 3. 2 Architecture de la méthodologie [233]

La méthodologie se décompose en cinq étapes et commence par l’acquisition des signaux vibratoires:

69
 Extraction des indicateurs : des indicateurs bruts tels que rms, kurtosis, l’écart-type, crête à
crête du signal de vibration, qui représentent différents aspects de l’état de santé du
roulement, sont extraits. Les indicateurs bruts ont des échelles différentes, et peuvent être
corrélés.
 Normalisation des indicateurs : les indicateurs bruts ont des échelles différentes. Pour éviter
la situation où les indicateurs bruts à plus grande échelle ont un poids plus important dans
l’ACP, les données sont normalisées de sorte que tous les indicateurs bruts soient dans la
même échelle.
 Réduction de dimension : les indicateurs normalisés sont analysés par l’analyse en
composantes principales (ACP). Après l’ACP, des ensembles de données orthogonaux à
dimensionnalité réduite peuvent être extraits, la variance cumulée atteint 80 % de la variance
totale, les composantes principales restantes sont rejetées et les trois premières composantes
représentent 98,8 % de la variance totale.
 Classification : une technique de classification basée sur la densité appelée OPTICS (Ordering
points to identify the clustering structure) est appliquée. Les résultats sont des classes de
différentes densités.
 Décision : la décision concernant les états de roulement est prise sur la base des densités des
classes.

En l’absence d’informations sur la vitesse de rotation, il serait difficile d’utiliser les indicateurs du
domaine fréquentiel et du domaine temps-fréquence. Dans cette étude, la vitesse de rotation est
supposée inconnue et seuls les indicateurs du domaine temporel sont extraits. 𝑀𝑖𝑛𝑃𝑡𝑠 contrôle la
taille minimale d’une classe. S’il est réglé trop bas, tous les points de données seront classifiés dans
une seule classe. Si elle est trop élevée, de nombreux points de données ne seront pas classifiés en
classe [233].

Classification en ligne pour la détection de l’écaillage et pour la


surveillance du comportement vibratoire. [234]

Cette méthodologie présente une classification dynamique pour la surveillance et la détection de


défaut de roulement[234]. Elle est basée sur trois phases :

La première phase est l’extraction des indicateurs mentionnés dans le tableau 3.1, à partir du signal
brut notamment des indicateurs temporels, et deux indicateurs extraits par l’analyse d’ondelettes et
le kurtosis spectral. Une matrice d’indicateurs est constituée à la fin de cette première phase.

La deuxième phase concerne la réduction de dimension par la méthode ACPK. Les trois premières
composantes principales sont sélectionnées car elles contiennent la plupart des informations

La troisième phase consiste à une classification et la prise de décision, la classification par D-DBSCAN
(Dynamic density-based spatial clustering of applications with noise). Dans la décision, si aucune
évolution de la nouvelle classe n’est détectée, l’état de santé du roulement sera considéré comme
stable, une fois qu’une nouvelle classe sera créée le roulement sera considéré comme défectueux. La
figure 3.3 représente l’organigramme du diagnostic de roulement par cette méthodologie.

70
Figure 3. 3. Organigramme du diagnostic de roulement par une classification dynamique, Méthode
D-DBSCAN [234]
Tableau 3. 1 Indicateurs temporels et fréquentiels utilisés par la méthode D-DBSCAN [234]

Domaine Indicateurs
Temps RMS Kurtosis Skewness Facteur Facteur Ecart type Pic
crête d'impulsion
Fréquence Centre de RMS Ecart-type
fréquences

Méthodes supervisées

L'apprentissage supervisé est une tâche d’apprentissage automatique consistant à apprendre une
fonction de prédiction à partir d’exemples étiquetés. C’est ce qu’on appelle l’apprentissage supervisé,
car le processus d’un algorithme tiré de l’ensemble de données de formation (training set) peut être
considéré comme un enseignant supervisant le processus d’apprentissage.

Méthode basée sur le réseau neuronal profond (DNN)[235]

La méthode basée sur le réseau neuronal profond (DNN) est une nouvelle méthode de reconnaissance
de l’état des roulements. Cette méthode est basée sur l’extraction de plusieurs indicateurs et les
réseaux neuronaux profond.

Tout d’abord, l’extraction des indicateurs (voir tableau 3.2) est réalisée dans les trois espaces de
représentation temporel, fréquentiel et temps-fréquence. Ensuite, l’algorithme de réduction de
dimension non linéaire auto-encoder basé sur l’apprentissage profond est proposé pour réduire les
informations de redondantes. Un auto-encoder est un réseau de neurones artificiels utilisé pour
l’apprentissage non supervisé de caractéristiques discriminantes. Le but d’une auto-encoder est
d’apprendre une représentation (codage) pour un ensemble de données, typiquement pour la
réduction de la dimensionnalité. Enfin, le classifieur de la couche supérieure du réseau neuronal

71
profond fournit l’état des roulements. La méthode proposée a été validée à l’aide des données de
vibration des roulements issues d’un banc d’essai.

La figure 3.4 représente le schéma utilisé dans cette méthodologie, par cinq étapes.

Figure 3. 4 Schéma d’estimation de l’état des roulements par le réseau neuronal profond [235]

Une comparaison a été faite dans [235] entre la méthode DNN en ajoutant la réduction de dimension
par l’auto-encoder et la méthode de classification de la machine à vecteur de support SVM en ajoutant
la réduction de la dimension de l’ACP. Cette comparaison a montré que La détection des défauts par
(DNN + auto-encoder) a une efficacité de 92.5 % par contre (SVM +ACP) atteint 89.2 %.

Tableau 3. 2 Les différents types d’indicateurs pour la méthode basée sur le réseau neuronal profond
[235].

Domaine Indicateurs
facteur facteur facteur
crête à facteur
Temporel RMS Kurtosis crête à de de Dissymétrie
crête d'impulsion
crête forme marge
Kurtosis
Fréquentiel
spectral
Temps-
Ondelettes
fréquence

Méthodes de classification dynamique basée sur le réseau neuronal


artificiel [236]

Les réseaux neuronaux artificiels sont utilisés pour plusieurs applications dans le domaine de
l’ingénierie. Ici, il est développé pour la surveillance des niveaux de vibration des roulements. Une
comparaison des performances de la classification des défauts dans les machines tournantes en
utilisant un couplage des réseaux de neurones artificiels (RNA) et les algorithmes génétiques. Les
signaux vibratoires ont été traités pour extraire deux types d’indicateurs qui sont utilisés comme

72
entrée au classifieur pour l’identification de quatre classes des défauts et la classe de fonctionnement
sain (sans défaut). Les performances de la classification ont été examinées avant et après sélection des
indicateurs par les algorithmes génétiques.

L’étude est portée sur la bague intérieure. Cinq conditions sont analysées: un roulement sain et quatre
défauts réalisées par électroérosion.

L'extraction des indicateurs a été réalisée à partir des indicateurs temporels et fréquentiels. Les
indicateurs temporels calculés, sont les suivants : la valeur efficace, le facteur de crête, le skewness, le
kurtosis, et les moments d’ordre 5 et 6. Les indicateurs fréquentiels calculés sont les énergies du
spectre dans quatre bandes de fréquences.

La sélection se fait à partir de l’algorithme génétique (AG). Les algorithmes génétiques appartiennent
à la famille des algorithmes évolutionnistes. Leur but est d’obtenir une solution approchée à un
problème d’optimisation, lorsqu’il n’existe pas de méthode exacte (ou que la solution est inconnue)
pour le résoudre en un temps raisonnable. Les algorithmes génétiques utilisent la notion de sélection
naturelle et l’appliquent à une population de solutions potentielles au problème donné.

Il y a deux phases moyennes dans l’application de réseau neuronal artificiel : la phase d’apprentissage
ou de formation et la phase de test. La phase d’apprentissage est critique car elle détermine le type de
tâches futures à résoudre. Une fois le réseau formé, la phase de test est suivie, dans laquelle les
indicateurs représentatifs des entrées sont traités. Après avoir calculé les poids du réseau, les valeurs
des neurones de la dernière couche sont comparées avec les résultats attendus pour vérifier la
pertinence de la conception.

Tableau 3. 3 Performances de classification pour les trois ensembles d’indicateurs calculés avant la
sélection par AG [236].

Indicateurs Performance Performance test % Nombre d’itérations


apprentissage %

temporels 100 85 7

fréquentiels 100 90 100

combinés 100 100 11

Dans cette étape le réseau est entraîné et testé (voir tableau 3.3) en utilisant le vecteur forme optimal
obtenu par l’algorithme génétique proposé. Les performances du RNA sur la base de test, en utilisant
le vecteur forme optimal, montrent une amélioration de la performance de la classification pour les
différents essais réalisés. Cette performance atteint 100%. (Toutes les observations sont correctement
affectées aux classes correspondantes) avec un nombre des indicateurs réduit La séparation des cinq
classes est, donc, réalisée avec un taux d’erreur nul.

L’algorithme de sélection d’indicateurs utilisé permet, donc, de choisir un sous-ensemble optimal


d’indicateurs d’un ensemble de caractéristiques obtenues par l’estimation de deux types d’indicateurs.
L’algorithme génétique a permis de diminuer le nombre d’indicateurs nécessaire à une bonne
classification. L’utilisation des techniques d’optimisation par AG et de la classification par un réseau de
neurone artificiel à côté du traitement du signal ont pu améliorer la surveillance des machines en
détectant l’évolution d’un défaut dans le temps.

73
Étude comparative des méthodes de classification supervisées et
non supervisées [237]

Des méthodes de reconnaissance de formes supervisées et non supervisées ont été utilisées dans cette
étude. L’attention des auteurs est portée sur l’évaluation de la sélection, de la performance et de
l’applicabilité des méthodes de reconnaissance de formes. L’étude est réalisée sur des données
collectées sur un banc d’essai de roulement dont l’état de détérioration de la bague extérieure est
connu.

La comparaison des méthodes de reconnaissance de formes a été effectuée sur un banc d’essai en
laboratoire qui a permis d’acquérir des signaux de vibration des roulements à billes dans quatre
conditions : roulement sain et roulements avec trois niveaux de dégradation. La procédure commence
par l’extraction des indicateurs temporels et fréquentiels comme la fréquence de passage de la bille
de la bague extérieure (BPFO), la fréquence de passage de la bille de la bague intérieure (BPFI), la
fréquence de rotation de la bille (BSF) et la fréquence fondamentale de cage (FTF). Quatre catégories
de défauts (normale, acceptable, alerte et conditions d’alarme) sont présentes. Dans cette étude la
méthode de réduction de dimension utilisée est l’analyse en composantes principales (ACP).

Tableau 3. 4 Méthodes de regroupement et de classification [237]

Type de classification Méthode Classification exacte de


l'ensemble des tests %

Régression logistique Supervisé/ Paramétrique 93

K-NN Supervisé/ Non paramétrique 87

Classifieur linéaire basé sur les Supervisé/ Paramétrique 98


densités normales

Classifieur quadratique basé sur Supervisé/ Paramétrique 97


les densités normales

Classifieur parzen Supervisé/ Non paramétrique 96

Classifieur moyen le plus proche Supervisé/ Non paramétrique 88

Réseau de neurones RBF Supervisé/ Non paramétrique 93

C-means logique floue Non-supervisé 89

K-means Non-supervisé 94

D’après le tableau 3.4, les algorithmes supervisés montrent une bonne précision dans la fourchette de
88 à 97 %, compte tenu des performances de classification obtenues grâce à l’utilisation d’un ensemble
de tests portant sur quatre indicateurs de base des roulements surveillés, à savoir les composantes de
la fréquence de passage de la bille de la bague extérieure (BPFO), la fréquence de passage de la bille
de la bague intérieure (BPFI), la fréquence de rotation de la bille (BSF) et la fréquence fondamentale
de la cage (FTF). Les algorithmes non supervisés montrent également une bonne précision dans la
plage de 89 à 94 % sur la base d'un nombre de classes préalablement déterminé égal à quatre états de
condition. Cette étude de faisabilité permet de recommander toutes les méthodes de classification à

74
utiliser dans un système de diagnostic commercial. Les méthodes non supervisées sont les plus
adaptées aux données opérationnelles même s’il n’est pas possible d’attribuer toutes les classes de
dysfonctionnement.

Contribution à la methode de surveillance en ligne par la


classification dynamique : adaptation de la méthode OPTICS
Les raisons pour lesquelles nous employons l’algorithme OPTICS sont multiples : la méthode OPTICS
est peu sensible au choix des paramètres  et MinPts , mais néanmoins il est toujours nécessaire de
bien déterminer et choisir les bonnes valeurs pour classifier et séparer correctement les classes. En
général, OPTICS nous donne une classification de tous les signaux de la base de données, ce qui nous
aide à extraire les classes de formes et de densités différentes. Par la suite, la méthode OPTICS consiste
à déterminer les zones de grande densité et celles de faible densité. La première phase de cette
méthode consiste à séparer les zones de forte densité de celles de faible densité par des sommets et
la deuxième phase consiste à sélectionner les classes. Les faiblesses de cette méthode se trouvent dans
le fait qu’elle ne supprime que quelques classes et dans le cas de diagrammes de distances
d’accessibilité avec plusieurs sommets, il y a toujours plusieurs classes qui ne sont pas vraiment des
classes. C’est pourquoi cette méthode n’est pas efficace pour la détection automatique des défauts.
Dans cette partie, mon travail consiste à améliorer la représentation qui était sous forme d’un
histogramme pour la transformer en nuage des points et aussi à associer plusieurs sommets pour
obtenir un seul sommet séparant l’état sain de l’état de défaut. La figure 3.5 (a) montre l’optimisation
réalisée sur l’algorithme OPTICS qui représente les résultats de la classification sous forme
d’histogramme. Par ailleurs, le diagramme en deux dimensions conduit à couvrir moins de pourcentage
de données et la séparation dans l’histogramme entre l’état sain et l’état défectueux devient difficile.
C’est pourquoi, nous avons modifié et optimisé l’algorithme OPTICS pour que cet algorithme s’intègre
dans le processus de reconnaissance de formes dynamique dans le cadre du diagnostic et du suivi de
défaut de roulement. Dans la figure 3.5 (b) on reprend le travail de la classification par OPTICS en
commençant à différencier entre sain et défaut par la couleur verte qui signifie l’état sain et par la
couleur rouge qui signifie l’état défectueux.

a b
Figure 3. 5 Les différentes représentations par la méthode OPTICS

75
Architecture de la méthode de reconnaissance de formes
développée
La figure 3.6 représente l’architecture de la méthode de reconnaissance de formes proposée. Cette
méthodologie repose sur trois boucles : initialisation, détection et suivi.

• Acquisition
• Extraction des indicateurs
Initialisation
• Normalisation
• Réduction de la dimension

• Acquisition
• Extraction des indicateurs
Détection • Normalisation
• Réduction de la dimension
• Classification OPTICS

• Extraction des indicateurs


• Normalisation
Suivi • Projection sur base finale
• Caractéristiques de la classe finale
• Suivi

Figure 3. 6 Architecture de la méthode de reconnaissance de formes développée.

La phase d’initialisation concerne l’initialisation de la matrice d’indicateurs de défauts ainsi que la


constitution d’une classe dite « classe saine ».

La phase de détection est une boucle de calcul qui consiste à :

 Constituer une matrice d’indicateurs et à la normaliser à partir des signaux enregistrés, à


l’instant t.
 Réduire la dimension de cette matrice par projection dans un espace à 3 dimensions.
 Appliquer la méthode de classification OPTICS pour détecter l’apparition d’une nouvelle classe
dite "classe défaut".

La phase de suivi consiste à projeter la matrice d’indicateurs de défauts dans la base qui a permis
de détecter la "classe défaut".

 Suivre dans le temps l’évolution de cette classe dans la base où l’on à détecter le défaut.

76
Première contribution: méthode IRT-OPTICS
La méthodologie IRT-OPTICS (Improved Real-Time OPTICS) est basée initialement sur la méthodologie
RT-OPTICS. Elle est améliorée par l’utilisation de plusieurs indicateurs et par le suivi. La figure 3.7
résume la méthodologie. Cette méthode est organisée en trois boucles :

La première boucle concerne l’initialisation, qui consiste en l’acquisition des signaux s(t) et permet
l’extraction des indicateurs Xk. Dans l’extraction, treize indicateurs Ik sont utilisés : six indicateurs
temporels, cinq indicateurs fréquentiels et deux dans le domaine temps-fréquence, comme indiqué
dans le tableau 3.5, les indicateurs extraits sont normalisés, et la réduction de dimension appliquée
pour réduire le nombre des indicateurs. Cette boucle a pour but de constituer la classe saine C1.

La deuxième boucle concerne la détection. Elle commence par l’acquisition des signaux s(t) et
l’extraction des indicateurs Xk. Ces indicateurs deviennent X knorm après la normalisation. La réduction
de dimension consiste à projeter l’ensemble des indicateurs de l’espace original sur un nouvel espace
de 3 dimensions. L’analyse en composantes principale (ACP) et sa variante non linéaire (ACP à noyau
ou ACPK) sont des outils puissants de synthèse de l’information, très utiles lorsque on a une quantité
importante de données quantitatives à traiter et à interpréter. Elle est utilisée dans nos travaux car la
réduction de dimension est une méthode très fréquente dans le domaine de détection des défauts des
machines tournantes. La réduction de dimension et la sélection des indicateurs préparent l’espace des
indicateurs réduits pour une utilisation dans la phase de classification. La préparation consiste à
sélectionner le meilleur ensemble d’indicateurs provenant de la phase de prétraitement et de
nombreux types de méthodes linéaires ou non linéaires des indicateurs porteurs d’information afin
d’obtenir l’espace d’indicateurs ayant les propriétés les plus prometteuses, c’est-à-dire qui améliorent
la classification et réduisent le surdimensionnement des données. La méthode de classification OPTICS
est enfin utilisée pour détecter la présence ou non d’une nouvelle classe C2 qui présente une "classe
de défaut". La base finale Bf est la base XYZ trouvée au moment de la détection la deuxième classe C2.
La classification s’arrête et on commence à projeter les indicateurs réduits sur cette base pour observer
l’évolution de défauts par les paramètres de suivi.

La boucle finale concerne le suivi dans le temps de la classe C2. Il s’agit de suivre l’état de dégradation
du composant mécanique, en particulier le roulement, afin de prévoir le remplacement du composant.
Cette boucle comprend, comme dans les étapes précédentes, l’acquisition, l’extraction, la
normalisation et la projection des données normalisées sur les trois dernières composantes principales
dans lesquelles on a détecté la présence du défaut (que nous appelons base Bf). Nous utiliserons
ensuite des paramètres indicateurs de la classe C2 pour le suivi de défaut tels que le contour, le centre
de gravité et la distance entre les deux classes (sain et défectueux).

La méthode OPTICS nécessite deux paramètres à régulariser comme 𝑀𝑖𝑛𝑃𝑡𝑠 et . Le choix de 𝑀𝑖𝑛𝑃𝑡𝑠
a été établi suite à plusieurs simulations et étude bibliographie afin de connaitre sa valeur optimale
pour les introduire dans la méthode OPTICS. Pour y parvenir, nous avons donné successivement une
valeur entière à 𝑀𝑖𝑛𝑃𝑡𝑠 variant de 2 jusqu’à 10 pour avoir la détection optimale. Le résultat était {3,
4} ce qui est presque la moitié de la matrice initiale. On suit le même processus pour  , d’après les
simulations on a identifié sa valeur entre 0.90 et 0.99.

Un certain nombre d’algorithmes d’apprentissage automatique - supervisés ou non, utilisent des


métriques de distance pour connaître le modèle de données d’entrée afin de prendre une décision.

77
Une bonne mesure de la distance permet d’améliorer considérablement les performances du
processus de classification et de recherche d’informations. Dans cette méthodologie l’algorithme
OPTICS utilise la distance Euclidienne que nous conservons.

Acquisition s(t)
Boucle 1: Initialisation

E𝐱𝐭𝐫𝐚𝐜𝐭𝐢𝐨𝐧 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐤

Normalisation 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐧𝐨𝐫𝐦


𝐤

NON OUI
t < 𝐓𝐡
𝐭 ← 𝐭 + 𝚫𝐭

Acquisition s(t)

E𝐱𝐭𝐫𝐚𝐜𝐭𝐢𝐨𝐧 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐤


Boucle 2: Détection

Normalisation 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐧𝐨𝐫𝐦


𝐤

Réduction de dimension 𝐘𝐪𝐧𝐨𝐫𝐦 , 𝐪 = 𝟑

Méthode OPTICS, Identification du ou des classes dans la 𝐁𝐟

NON OUI
Une Classe
𝐁𝐟 ← 𝐁

Acquisition s(t)

E𝐱𝐭𝐫𝐚𝐜𝐭𝐢𝐨𝐧 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐤


Boucle 3: Suivi

Normalisation 𝐝𝐞𝐬 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞𝐮𝐫𝐬 𝐗 𝐧𝐨𝐫𝐦


𝐤

Projection on 𝐁𝐟

Caractéristiques de la classe C2

Suivi
𝐭 ← 𝐭 + 𝚫𝐭

Figure 3. 7 Organisation des boucles pour IRT-OPTICS

78
Pseudocode IRT-OPTICS
1. Initialisation : Acquisition – Extraction – Normalisation – Matrice initiale d’indicateurs M .
init
2. Détection : Acquisition – Extraction Normalisation– Réduction de dimension – Classification
Si C2 détecté.
3. Suivi de défaut : calcule la Densité – Distance - Contour

Les indicateurs

On a donc choisi les indicateurs qui selon nous, sont les plus adaptés et les plus utilisés en analyse
vibratoire. La liste de la sélection des indicateurs est proposée dans le Tableau 3.5. La méthode
proposée utilise treize indicateurs répartis dans les trois espaces de représentation des signaux.

Tableau 3. 5 Extractions dans les domaines temporel, fréquentiel et temps-fréquence.

Indicateurs temporels Indicateurs fréquentiels Indicateurs temps-échelle


1 1 1
1 N K K
xRMS =( ∑i=1(xi2 ))
2 ∑k=1 (fk −fc)2 s(k) 2 ∑ fj 2 WS (fj)
2
N xfstdb= ( K ) j=1
∑k=1 s(k) xWRMS = ( K )
∑ WS (fj)
j=1
N 1 K
4 K 2
1 (xi − x̅) s(k) ∑ WS (fj )
Kurtosis = ∑ xrmsf = (∑ ( )) j=1
K xPCWT =
N σ4 k=1
K−1
i=1
K
xcc = max (xi ) - min (xi ) ∑k=1 fk s(k)
xfc = K
∑k=1 s(k)
xcc 1
xc = K 2
xRMS ∑ f2
k s(k)
k=1
xfrmsb =( K )
∑k=1 s(k)

N K
(xi − x̅) 3 1
1 xrms = ∑ s(k)
Dissymétrie = ∑ K
N (N − 1)σ3 k=1
i=1
Max(∣ x ∣)
FI =
1 N
∑ ∣ xi ∣
N i=1

Normalisation

La normalisation est une technique souvent appliquée dans la préparation des données pour les
besoins de la Machine Learning. L’objectif de la normalisation est de modifier les valeurs des colonnes
numériques de l’ensemble de indicateurs pour utiliser une échelle commune, sans que les différences
entre les domaines de valeurs ne soient faussées et sans perte d’informations. Certains algorithmes
ont également besoin d’une normalisation pour modéliser correctement les indicateurs. La méthode
utilisée dans cette thèse est la normalisation Z-score.

Réduction de dimension

La réduction de dimension dans cette méthodologie est utilisée par deux méthodes:

 L’analyse en composantes principales (ACP).


 L’analyse en composantes principales par noyau (ACPK).

79
Les paramètres de suivi

Le suivi est associé à la détection de défaut suite à la création d’une nouvelle classe. Cette étape
permet le suivi de l’évolution de la taille du défaut le déplacement du centre de la classe et la variation
de la condition de fonctionnement. Nous avons utilisé trois paramètres géométriques. Les choix de ces
paramètres géométriques sont liés à la nature du défaut crée sur la surface de la bague extérieure du
roulement. Pour le suivi de dégradation du défaut (suivi de la classe C2), les paramètres utilisés sont
les suivants :

La densité

La densité (GV3) est le nombre de points du groupe, Nf , pour une zone Af .


Nf
GV3 =
Af (3.1)

Le contour

Le contour (GV4) de la classe est calculé à partir d’une enveloppe convexe. L’enveloppe convexe d’un
ensemble de points est le plus petit ensemble convexe qui contient les points. L’algorithme de
l’enveloppe convexe est intégré à Matlab par le moyen d’une fonction convhulln.

La distance

La distance (GV5) correspond à la distance du centre de classe C2 entre deux temps successifs t et t+1,
(Éq.3.2). Cent 2,t est le centre de classe au temps t.
1
2 2
GV5 = (C2(t), C2(t + 1)) = (d (cent2,t ; cent2,t+1 )) .
(3.2)

Les trois paramètres servent à surveiller l’évolution de l’équipement dégradé avec le temps, ce qui
nous donnera une idée générale du moment où il faudra changer l’équipement et le remplacer par un
nouveau.

Deuxième contribution: méthode AOC-OPTICS


Architecture globale

Dans cette nouvelle architecture, nous proposons toujours les trois étapes: initialisation, détection et
suivi.

La méthodologie AOC-OPTICS (Automatic Online Classification-OPTICS) est basée initialement sur la


méthodologie IRT-OPTICS. Elle intègre des améliorations notamment en termes d’automatisation et
de performance. Les apports concernent l’utilisation de plusieurs indicateurs suivie d’une réduction et
d’un filtrage des indicateurs, le remplacement de la distance euclidienne par la distance Manhattan,
l’automatisation des paramètres OPTICS, 𝑀𝑖𝑛𝑃𝑡𝑠 et .

Le tableau 3.6 montre le pseudocode pour la méthode AOC-OPTICS. Cette méthode est organisée en
trois boucles.

80
Tableau 3. 6 Pseudocode pour la méthode AOC-OPTICS
Entrées Th , n, Δt
Δt est l’intervalle de temps entre deux collectes de données
n est le nombre de signaux collectés à un moment donné kΔt
Th est le temps et la base initiale d’indicateurs
Avec 3 numero de composant principale (3D)
Sorties nc , Plot GV = f(kΔt)
GV sont les valeurs géométriques
nc est le nombre de classes (=1 pour une condition saine, = 2 pour des conditions saine
et défectueuse)
Phase 1 k = 0, nc = 1
Initialization Tant que kΔt < Th
Collecte de n signaux
Calcul de p indicateurs [HI]p,(k+1)n
k←k+1
Fin de Si
̅̅̅̅̅i
HIi −HI
Normalisation [HI]norm norm
p,(k+1)n avec [HI]i,(k+1)n = écart type(HIi )
Classement des indicateurs
Application de la t-SNE :
tSNE([HI]norm
p,(k+1)n ) = [FI]3,(k+1)n
Calculer ε
Phase 2 Tant que nc = 1
Detection Collecte de n signaux
Calcul de p indicateurs [HI]p,(k+1)n
̅̅̅̅̅i
HIi −HI
Normalisation [HI]norm norm
p,(k+1)n avec [HI]i,(k+1)n = écart type(HIi )
Classement des indicateurs
Application de la t-SNE :
tSNE([HI]norm
p,(k+1)n ) = [FI]3,(k+1)n
Application de OPTICS -> nc = 1 ou 2
k←k+1
Fin Tant que
Identification de la base Bf
Phase 3 Tant que kΔt < Tfin où Tfin est le temps de défaillance.
Suivi Collecte de n signaux
Calcul de p indicateurs [HI]p,(k+1)n
̅̅̅̅̅i
HIi −HI
Normalisation [HI]norm norm
p,(k+1)n avec [HI]i,(k+1)n = écart type(HIi )
Projection sur la base Bf -> [FI]3,(k+1)n
Calcul des valeurs géométriques GV
Courbe GV = f(kΔt)
k←k+1
Fin de Tant que

 La phase 1 considère que lorsqu’un roulement fonctionne, il est sain pendant un intervalle Th .
Cette phase permet l’initialisation de la méthode.
 La phase 2 correspond à la phase de détection de défaillance. L’agglomération des données
est utilisée pour une détection précoce et fiable des défaillances.

81
 La phase 3 correspond au suivi de l’évolution de la défaillance. Compte tenu de la nature
évolutive de la défaillance, la troisième phase est une boucle de suivi de cet état par des
paramètres géométriques de la deuxième classe (état de défaut). Elle se déroule jusqu’à la
défaillance du roulement. Chaque phase est décrite dans les sections suivantes et le tableau
3.6 indique le pseudocode associé.

Phase 1: Initialisation

La première boucle est exécutée pour une durée Th , qui est supposée être une phase saine du
roulement et la base initiale d’indicateurs. Pour chaque itération k, n signaux sont collectés, les
indicateurs (p = 17) sont extraits dans les domaines temporel, fréquentiels et/ou temps-échelle.
L’utilisation d’une caractéristique multi-domaine dans la détection des roulements défectueux peut
offrir un diagnostic d’efficacité pour différents défauts de roulements, avec une vitesse et une charge
variable. Les Indicateurs calculés dans cette contribution sont ceux du Tableau 3.5, indicateurs
précédemment utilisés par IRT-OPTICS, et du Tableau 3.7, indicateurs supplémentaires.

Tableau 3. 7 Indicateurs calculés.

Domaine Indicateurs
K K
fréquentiel 1 1
xrms = ∑ s(k) PW = ∑ s 2 (k)
K K
k=1 k=1

temporel Talaf= log (Ku + RMS / RMS(S)); Tikhat=log ((Ku). ^ xCF + RMS / RMS(S)).^ xC );

Au moment Th , la matrice de l'indicateur [HI]i est normalisée [HI]norm


i , équation (3). La
normalisation vise à transformer le calcul pour qu'il soit à une échelle similaire.

HIi − ̅̅̅̅
HIi
[HI]norm
i,(k+1)n = (3.3)
écart type(HIi )

Une étape de classement des indicateurs est appliquée. Les méthodes de classement sont importantes
pour éliminer les indicateurs sans importance avant de réduire la dimension. Le calcul des indicateurs
prend beaucoup de temps en raison de la quantité massive de données. Pour réduire ce long
processus, nous avons suggéré la méthode de classement des indicateurs afin de minimiser le nombre
d’indicateurs, ce qui peut rendre le calcul plus rapide, sans toucher à la précision de la détection du
défaut. Pour AOC-OPTICS, deux méthodes sont comparées dans la section 4.4: la méthode Relief et la
méthode du Khi- carré.

Bien que la nuisance de la dimensionnalité pose de sérieux problèmes, le traitement de données à


dimensions élevées présente l’avantage que les données peuvent donner plus d’informations. La
méthode de réduction de l’encastrement stochastique voisin distribué par t (t-SNE) est un puissant
outil de réduction de dimensions, le nombre de dimensions est réduit à 3 pour conserver un aspect
visuel. Une comparaison avec une réduction à deux dimensions sera faite en chapitre 4. Enfin, le calcul
de ε est effectué après une réduction de la dimension. ε correspond à la distance maximale entre le
centre de la classe et le 𝑀𝑖𝑛𝑃𝑡𝑠 th voisin, équation (3.4).

82
ε = distance(C1, 𝑀𝑖𝑛𝑃𝑡𝑠 th neighbor) (3.4)

La classe résultante est une classe dite saine, notée C1, avec centre c1. Cette classe correspond à un
état de référence.

Phase 2: Détection

La deuxième phase est une étape de détection de la défaillance mécanique. L’objectif de cette phase
est de détecter un nouvel état appelé classe défectueuse, noté C2. A chaque nouvelle itération k, les
indicateurs sont extraits, normalisés par la méthode Z-scores, puis réduits et sélectionnés par la
matrice des indicateurs comme dans la phase précédente. La nouvelle matrice d’indicateurs
sélectionnée est réduite et classifiée puis testée par la méthode OPTICS pour détecter ou non une
seconde classe. Si une seule classe est obtenue, ce qui correspond à l’état sain, l’algorithme reste en
phase de détection, ces nouvelles données alimentent l’état sain. Si deux classes sont détectées, cette
nouvelle classe C2, est obtenue dans un plan Bf, qui sera conservé pour la phase de suivi.

Phase 3 : Suivi

La troisième étape est réalisée dans le plan Bf déterminé lors de la phase précédente. Il est important
de conserver le même plan afin de visualiser l’évolution des indicateurs. Ce plan est le meilleur plan
pour suivre l’évolution de la défaillance du roulement. A chaque nouvelle série de données, les
indicateurs sont extraits, normalisés et projetés dans le plan Bf. A partir de ces indicateurs,
[FI]3,(k+1)n , cinq paramètres géométriques GVi sont calculés pour suivre l’évolution dans le temps.

Calisnki-Harabasz

L’indice de Calisnki-Harabasz est basé sur la densité et les classes séparées [238]. Le coefficient de
Calisnki-Harabasz, GV1, également appelé critère de rapport de variance, est une mesure basée sur la
dispersion des classes et entre eux. Nous choisirons le nombre de classes qui maximise la valeur
GV1 pour les classes :
∑i p d2 (c2, c2 + 1)
nc − 1
GV1 = (3.5)
∑xϵC2 d (x, c2 (t + 1 ) ∑xϵC2 d2 (x, c2(t) )
2
p − nc + p − nc

p est le numéro des indicateurs. Le centre de classe c2 entre deux temps successifs t et t+1. nc est le
nombre de clusters. d est la distance euclidienne entre x, ci

Davies-Bouldin

L’indice Davies-Bouldin mesure la moyenne de similitude entre chaque classe. Un faible indice signifie
une meilleure configuration de classe. C’est une métrique pour évaluer les algorithmes de
classification. Il s’agit d’un schéma d’évaluation interne, dans lequel la validation de la qualité de la
classification est effectuée à l’aide des quantités et des indicateurs inhérents à l’ensemble des
données. Cela présente l’inconvénient qu’une bonne valeur rapportée par cette méthode n’implique
pas la meilleure récupération d’informations [239].

83
L’indice Davies-Bouldin mesure la moyenne des similarités entre chaque groupe. Un indice plus faible
signifie une meilleure configuration des classes. R ij est la mesure de similarité de deux classes i et j.
nc est le nombre de classes.

1
GV2= ∑ni=1
c
Ri Avec R i = max (R ij ), i = 1 … nc (3.6)
nc j=1.…nc, i≠j

La densité

La densité est le nombre de points du groupe, Nf , pour une zone Af .

Nf
GV3 = (3.7)
Af

Le contour

Le contour GV4 de la classe est calculé à partir d’une enveloppe convexe. L’enveloppe convexe d’un
ensemble de points est le plus petit ensemble convexe qui contient les points. L’algorithme de
l’enveloppe convexe est intégré à Matlab par le moyen d’une fonction convhulln.

La distance
1
2 (3.8)
GV5 = (C2(t), C2(t + 1)) = (d2 (cent2,t ; cent 2,t+1 )) .

La distance GV5 est la distance entre les centres de la classe C2 pour deux temps successifs t et t+1,
(Éq.3.8). Cent C2,t est le centre de la classe au temps t.

Résumé des deux méthodologies IRT-OPTICS et AOC-OPTICS


Le tableau 3.8 suivant représente un résumé des deux méthodologies proposées dans cette thèse avec
les différents paramètres impliqués, automatisées et optimisées pour donner une meilleure détection
et classification.

Tableau 3. 8 IRT-OPTICS et AOC-OPTICS

Paramètres IRT-OPTICS AOC-OPTICS


𝑴𝒊𝒏𝑷𝒕𝒔 3 1
T
2 h
 0.9 Flexible selon Th .(Eq. 3.4)

Distance Euclidien Manhattan

Indicateurs Ciblé manuellement Ciblé à partir de la méthode de filtrage

Réduction de dimension Linéaire (ACP), non linéaire (ACPK) Non linéaire (ACPK), (t-SNE)

Suivi Distance, Densité, Contour Distance, Densité, Contour, indice de


Davies-Bouldin, indice de Calinski

84
CONCLUSION
Dans ce chapitre nous avons présenté deux méthodes de reconnaissance de formes dynamiques dans
le cadre du diagnostic et du suivi de défaut de composants mécaniques, en particulier les roulements
basés sur l’algorithme OPTICS : IRT-OPTICS, et AOC-OPTICS.

Les deux contributions sont composées de trois boucles. Pour la méthode IRT-OPTICS, l’initialisation
permet de constituer la classe dite saine avec des étapes d’acquisition, d’extraction des indicateurs,
de normalisation des indicateurs extraits, de réduction de dimension. L’initialisation dans le cas de
AOC-OPTICS se différencie de la méthode IRT-OPTICS par l’ajout de la méthode Relief pour filtrer et
réduire le nombre des indicateurs. De plus on établit le calcul des paramètres MinPts et . La deuxième
boucle qui est la phase de détection suit la même procédure que dans la phase d’initialisation suivi
d’une classification OPTICS jusqu’à l’obtention d’une deuxième classe, synonyme d’une classe
défectueuse. Finalement la boucle de suivi consiste à visualiser et surveiller l’évolution de défaut dans
le temps. Dans IRT-OPTICS le suivi de l’état de dégradation dans la machine est réalisé avec la distance
entre les deux classes saine et défectueuse, ainsi que par le contour et la densité de la classe de
défauts. Dans AOC-OPTICS est établi avec cinq paramètres, trois de IRT-OPTICS en ajoutant l’index de
Calinski et Davies-Bouldin.

85
CHAPITRE IV
VALIDATIONS NUMERIQUE ET EXPERIMENTALE.

86
Introduction

Ce chapitre présente la validation des méthodes proposées dans le chapitre 3, IRT-OPTICS et AOC-
OPTICS. Cette validation a été réalisée sur des données numériques avant de les valider
expérimentalement. L’évaluation numérique est faite à partir de la génération d’une base de données
représentant les défauts de roulement. La validation expérimentale a été réalisée sur deux modules :
nous avons monté, sur le premier module, un roulement avec un défaut de différentes tailles créé
artificiellement. Le deuxième module est un banc de fatigue sur lequel est monté le roulement à
surveiller du banc d’essais SURVIB, disponible à l’Université de Reims Champagne Ardenne.

1. Investigation analytique
Modèle analytique des défauts

Le modèle analytique représente le défaut de la bague extérieure. Pour valider les deux
méthodologies, un modèle mathématique représentant la signature vibratoire du roulement avec un
défaut de la bague extérieure xbpfo est utilisé. Ce modèle décrit l’impact produit par le défaut de la
bague extérieure à chaque passage d’un élément roulant selon le temps t, (Eq. (4.1) -(4.2)) [240].
Quatre paramètres peuvent influencer la signature vibratoire : l’amplitude A, la vitesse de rotation fr ,
le facteur d’amortissement μ et l’amplitude du signal bruit b(t). Fbpfo représente la fréquence de
passage de la balle pour la bague extérieure, z est le nombre de billes, α est l’angle de contact entre
les billes et la piste de roulement, k est le nombre d’impulsions, f0 est la fréquence de résonance de
la structure.
N
k k
xbpfo (t) = ∑ A. exp (−2πµf 0 (t − )) . sin (2πf 0 (t − )) + b(t)
Fbpfo Fbpfo (4.1)
k=1
Z 𝑑 (4.2)
Fbpfo = f (1 − cos(α))
2 r D

Tableau 4. 1 Dimensions du roulement SKF6206

Symbole D0 Di D Z d α
Diamètre Diamètre Diamètre Nombre de Diamètre
Informations Angle
extérieur intérieur primitif billes de la bille
Valeurs 62mm 30mm 46mm 9 9.525mm 0◦

Le roulement simulé est de type SKF6206 dont les dimensions sont indiquées dans le Tableau 4.1.
Chaque signal contient 16384 échantillons (N) avec un taux d’échantillonnage de 51,2 kHz. Par la suite,
nous considérerons l’amplitude (A) comme corrélé à la taille de défaut. La figure 4.1 représente 3 états
de la bague extérieure du roulement type SKF6206, un signal sain où on ne voit pas le défaut, un signal
où l’on voit un début de défaut avec l’apparition des chocs répétitifs, un signal où l’on voit clairement
les chocs.

87
a b c

Figure 4. 1 Exemples de signaux de la bague extérieure : (a) à l’état sain, (b) pour une faible amplitude, (c)
pour une amplitude élevée permettant de visualiser les chocs répétitifs

Validation de la méthodologie IRT-OPTICS


1.2.1. Création de données numériques

Afin d’étudier l’influence des différents paramètres du modèle analytique, nous avons créé une base
de données en faisant varier l’amplitude, la vitesse et l’amortissement. Les variables de cette base de
données créée numériquement dans cette méthodologie augmentent d’une façon linéaire.

Pour l’amplitude A, nous avons fait varier sa valeur entre 10−3 à 2.01.10−1 avec un pas de 10-2 et les
autres paramètres sont fixes, 21 valeurs d’amplitude sont sélectionnées. Pour chaque amplitude A, 10
signaux sont simulés avec une variabilité de ± 5% sur les cinq paramètres. Cette variabilité est
gaussienne qui nous permet d’avoir une simulation plus proche de la réalité des signaux. Ainsi, la base
de données globale est constituée de 210 signaux. Les signaux sont numérotés en valeurs croissantes.
Les signaux n°1 à 10 correspondent à une amplitude A =10-3.

Pour la vitesse, nous avons fait varier la vitesse de rotation fr entre 1000 tr/min et 1100 tr/min avec
un pas de 10 tr/min. Cela nous donne 100 signaux, avec une fixation de l’amplitude A à 0.05 et de
l’amortissement µ à 0.05.

Pour l’amortissement nous avons fait varier le facteur d’amortissement μ entre 0,0455 à 0,0550 et un
intervalle de 10-3, pour une amplitude donnée A= 0.05 et une vitesse de rotation fr =1000 tr/min, ce
qui nous donne 100 signaux.

Le tableau 4.2 montre les 3 bases de données en fonction de A, fr et μ.

Tableau 4. 2 Caractéristique simulée

Effet de A Effet de 𝐟𝐫 Effet de μ


𝐀 0.001:0.01:0.201 0.05 0.05
𝐟𝐫 (rpm) 1000 1000:10:1100 1000
𝛍 0.05 0.05 0.0455:0.001:0.055
𝐟𝐨 (kHz) 10 10 10
b(t) 0.01 0.01 0.01
1.2.2. Effet de la vitesse

La méthodologie IRT-OPTICS est appliquée sur les 100 signaux. Les résultats de la méthodologie sont
présentés dans la figure 4.2 pour deux méthodes de réduction de dimensions ACP et ACPK.

88
a b
Figure 4. 2 Effet de la vitesse, IRT-OPTICS : (a) BPFO avec la méthode ACPK, (b) BPFO avec la méthode ACP

La figure 4.2 montre que la méthodologie IRT-OPTICS ne détecte pas la deuxième classe. Ainsi, un des
changements de la vitesse de rotation n’a aucune influence sur l’apparition d’une nouvelle classe, mais
il modifie seulement le déplacement de la base dans la classe saine (C1).

1.2.3. Effet du facteur d’amortissement

La méthodologie IRT-OPTICS est appliquée sur les 100 signaux. Les résultats de la méthodologie sont
présentés dans la figure.4.3 pour deux méthodes de réduction de dimension ACP et ACPK. La variation
du facteur d’amortissement, comme la vitesse de rotation, n’a aucune influence sur la création d’une
nouvelle classe et n’affecte que le mouvement du classe (C1).

a b
Figure 4. 3 Effet du facteur d’amortissement, IRT-OPTICS : (a) avec la méthode ACPK, (b) avec la méthode
ACP

Effet de l’amplitude

Les figures 4.4 et 4.5 montrent les résultats obtenus par IRT-OPTICS pour les signaux n°20, n°30, n° 40
et n° 210 avec une amplitude de 1.1.10-2, 2.1.10-2, 3.1.10-2 et 2.01.10-1.

Le roulement sain correspond à une amplitude variant entre 10-3, et 2.1.10-2. La méthode IRT-OPTICS
détecte le défaut (deuxième classe C2) à partir de quarantième signal avec les deux méthodes de
réduction de dimensions: l’analyse en composantes principales (ACP) figure 4.4, et l’analyse en
composantes principales à noyau (ACPK) figure 4.5.

89
a b

c d
Figure 4. 4 Effet de l’amplitude, IRT-OPTICS avec la méthode ACP (a) Signal n°20, (b) Signal n°30, (c) Signal
n°40, (d) Signal n°210

a b

90
c d
Figure 4. 5 Effet de l’amplitude, IRT-OPTICS avec la méthode ACPK (a) Signal n°20, (b) Signal n°30, (c)
Signal n°40, (d) Signal n°210

Tableau 4. 3 Résultats de la détection de défauts. N : non-détection de défaut ; D : Détection du défaut.


Numéro du signal 10 20 30 40-210
ACPK N N N D
ACP N N N D

Le Tableau 4.3 synthétise les résultats obtenus par les deux méthodes (ACP, ACPK) en termes de
détection des défauts. L’IRT-OPTICS permet d’utiliser les informations de ces treize indicateurs pour
détecter les défauts à un stade plus précoce. Nous observons que jusqu’au signal 30, il n’y a pas de
détection du défaut par les deux méthodes de réduction de dimension (ACP, ACPK). L’IRT-OPTICS en
temps réel commence à détecter le défaut dans la bague extérieure à partir du signal numéro 40. Avec
les deux méthodes on détecte le défaut au même temps c’est-à-dire aucun effet mais seulement on
peut constater que les limites de la base finale Bf dans le cas de l’ACPK sont plus grandes que celles de
l’ACP ce qui nous donne une séparation plus grande entres les classe saine et défectueuse.

1.2.4.1. Suivi de la classe C2 "classe défectueuse"

Cette classe C2 a été obtenue en faisant varier l’amplitude A de 3.1.10-2 jusqu’à 2.01.10-1, ce qui
correspond à signaux numéro 40 jusqu’au 210.
6 16 7
5.5 14
6
5 12
5
10
4.5
contour

4
Distance

8
Densité

4 3
6
3.5 2
4
3 2 1
2.5 0 0
3 6 9 12 15 18 21 3 6 9 12 15 18 21 3 5 7 9 11 13 15 17 19 21
Amplitude Amplitude Amplitude

a b c
Figure 4. 6 Méthodologie IRT-OPTICS, le suivi des défaillances se réfère à (a) la distance (b) le contour (c)
la densité

91
La classe C2 représente la classe défectueuse dans la figure. 4.6 où (a) représente la distance entre les
deux classes, (b) représente le contour et (c) représente la densité. Les augmentations de la distance
et du contour sont croissantes avec l’amplitude. Alors que le contour montre une augmentation plus
importante que la distance. La densité présente deux zones ; la première zone diminue puis devient
constante dans la deuxième zone. On déduit que ces paramètres, en effet, nous ont permis de mieux
suivre la dégradation du roulement.

Validation de la méthodologie AOC-OPTICS

La deuxième méthodologie utilisée est AOC-OPTICS. La création de la base de données est faite à partir
de l’implantation de la formule exponentielle(Eq.4.4) dans (Eq.4.1) à la place de l’amplitude A. La
formule exponentielle permet de produire une base de signaux qui augmente légèrement ce qui rend
difficile la détection des défauts.

e4ω − 1
A= (4.4)
e4
Création de données numériques

Pour simuler l’apparition et l’évolution du défaut, la base de données est constituée de 51 valeurs
différentes de l’amplitude A, notées Ai avec i = 1 … 51. Pour chaque valeur, 20 signaux sont générés
avec une variabilité gaussienne de ± 5% pour les trois paramètres fr , μ, fo , tableau 4.4. Ainsi, la base
de données est faite sur 1020 signaux ordonnés d’une façon croissante.

Pour l’amplitude Ai=1−10 c’est-à-dire les signaux de 1 jusqu’à 200, l’amplitude est constante égale à
zéro. L’amplitude augmente de Ai=11−51 , soit du signal 201 jusqu’à 1020 avec l’introduction de
l’équation 4.4 dans l’équation 4.1. Le tableau 4.4 résume les paramètres permettant la création de la
base de données.

Tableau 4. 4 Paramètres de simulation

signaux n° 𝟏 − 𝟐𝟎𝟎 𝟐𝟎𝟏 − 𝟏𝟎𝟐𝟎


𝐀 0 (e4ω − 1 )
e4
ω 0 0:0.025:1
𝐟𝐫 (rpm) 1000± 5% 1000± 5%
𝛍 0.05± 5% 0.05± 5%
𝐟𝐨 (kHz) 10± 5% 10± 5%
b(t) 0.1:0.2:0.5 0.1:0.2:0.5
Effet des paramètres internes de la méthode OPTICS
1.3.2.1. Epsilon et MinPts

AOC-OPTICS utilise deux paramètres Epsilon (𝜀) et 𝑀𝑖𝑛𝑃𝑡𝑠. Ils sont calculés dans la phase
d’initialisation, après avoir collecté toutes les données. 𝜀 dépend de la valeur de 𝑀𝑖𝑛𝑃𝑡𝑠. Pour la
simulation, 𝜀 a une valeur dans une plage [0,909-0,920] pour une plage 𝑀𝑖𝑛𝑃𝑡𝑠 = [2,20]. La valeur de
ε est liée à la valeur de 𝑀𝑖𝑛𝑃𝑡𝑠 qui varie entre 2 et 20 simultanément ε varie entre la valeur de 0.909
et 0.92 (voir équation 3.4). Cette valeur ne varie donc que légèrement pendant la phase d’initialisation.
Sa valeur pour des 𝑀𝑖𝑛𝑃𝑡𝑠 éme voisins est conservée pour le reste de l’algorithme. La Figure 4.7
confirme la valeur de 𝜀. Après la phase d’initialisation, la valeur de 𝜀 augmente brusquement.

92
Figure 4. 7 𝜺 en fonction de 𝑴𝒊𝒏𝑷𝒕𝒔 pour un bruit de niveau 𝟎. 𝟏𝐛(𝐭)

𝑀𝑖𝑛𝑃𝑡𝑠 est liée au nombre de signaux pour un instant. Le Tableau 4.5 montre les effets de 𝑀𝑖𝑛𝑃𝑡𝑠
pour trois niveaux de bruit 0.1 b(t), 0.3 b(t), 0.5 b(t). Ce tableau a pour but de représenter l’efficacité
de  automatisé et de 𝑀𝑖𝑛𝑃𝑡𝑠, avec l’état initial qui est la distance euclidienne qui existe dans
l’algorithme OPTICS, et tous les indicateurs (dix-sept indicateurs). Ce Tableau nous permet de conclure
Th
que la valeur optimale de 𝑀𝑖𝑛𝑃𝑡𝑠 est . (Nombre de signaux dans la matrice initiale) Cette valeur de
2
𝑀𝑖𝑛𝑃𝑡𝑠 permet de détecter le défaut avant les autres.

Tableau 4. 5 Effet de 𝑴𝒊𝒏𝑷𝒕𝒔 sur le temps de détection, avec la distance Euclidienne, 17 indicateurs, 𝜺
=0,094.
𝑴𝒊𝒏𝑷𝒕𝒔 0.1 b(t) 0.3 b(t) 0.5 b(t)
𝐓𝐡 240 260 280
𝟖
𝐓𝐡 220 260 280
𝟒
𝐓𝐡 220 240 240
𝟐
1.3.2.2. Effet de la distance

Cette section étudie l’un des paramètres de l’algorithme OPTICS, qui a un impact significatif sur les
classes. La sélection de la mesure de distance affecte les résultats des algorithmes de classification. Le
Tableau 4.6 ci-dessous montre l’effet de la distance implantée dans la méthode AOC-OPTICS pour trois
niveaux de bruit. La distance de Manhattan peut conduire à la détection du défaut avec une précision
globale pour les différents rapports signal/bruit égale à 96,7%, la distance de Mahalanobis peut
conduire à une détection de défaut avec une précision de 88,2%, pour les autres distances, la précision
est égale à 85,5%.
Th
Tableau 4. 6 Effet des distances, avec 𝑀𝑖𝑛𝑃𝑡𝑠 = 2
, 17 Indicateurs, 𝜀 = 0.094
0.1 b(t) 0.3 b(t) 0.5 b(t) Précision global
Euclidean 220 240 240 85.5 %
Mahalanobis 220 240 260 88.2 %
Manhattan 200 200 220 96.7 %
Minkowski 220 240 240 85.5 %
Chebychev 220 240 240 85.5 %

(3∗200) (4.5)
Précision globale = 100 3∗ VD
.

93
Dans (Eq. 4.5) le chiffre 3 signifie les trois niveaux de bruit, le nombre 200 représente les valeurs des
signaux sains et VD est la somme de la valeur des signaux au moment de détection des défauts dans
l’une des distances mentionnées dans le tableau 4.6.

1.3.2.3. Effet du classement des Indicateurs.

Généralement, le classement des indicateurs de défauts utilisé dans le prétraitement des données est
une subdivision des indicateurs. Le concept utilisé consiste à calculer la méthode des k plus proches
voisins et à définir le vecteur de pondération des indicateurs, qui peut distinguer les Indicateurs des
voisins de diverses classes.

Nous avons comparé deux méthodes : le Khi carré et Relief, tableau 4.7. L’étude comparative présente
l’efficacité de la méthode Relief qui peut détecter le défaut avec une haute précision à partir de dix
indicateurs jusqu’à la fin. Le Khi carré commence à reconnaître avec une grande efficacité à partir de
douze indicateurs. D’après les résultats du tableau 4.7, on peut conclure que la méthode de classement
des indicateurs par la méthode Relief est la meilleure, juste dix indicateurs suffisent pour obtenir la
plus grande précision.

Tableau 4. 7 Précision globale. Effet des indicateurs de classement avec la distance de Manhattan,
𝐓𝐡
𝑴𝒊𝒏𝑷𝒕𝒔 = , 𝜺 = 𝟎. 𝟎𝟗𝟒
𝟐
Méthode Nombre des Indicateurs
4 5 6 7 8 9 10 11 12 13 14 15 16 17
Khi- carré % 83 83 83 83 83 83 85.7 93.7 96.7 96.7 96.7 96.7 96.7 96.7
Relief % 85.7 85.7 85.7 85.7 85.7 85.7 96.7 96.7 96.7 96.7 96.7 96.7 96.7 96.7

Effet de la vitesse

L’effet de la vitesse de rotation est étudié dans cette partie avec la méthodologie AOC-OPTICS
appliquée avec la méthode de réduction de dimension t-SNE et ACPK dans les trois états de bruit avec
0.1b (t), 0.3b (t) et 0.5b (t). La base de données est sélectionnée parmi 51 valeurs, ce qui donne une
base de données de 1020 signaux. L’amplitude utilisée est égale à A = 0 et le facteur d’amortissement
μ = 0, 05.

La méthodologie AOC-OPTICS ne détecte pas deux classes mais seulement une seule classe, dans les
deux méthodes de réduction de dimension et le changement de valeur de bruit figure 4.8.

a b
Figure 4. 8 Effet de la vitesse, AOC-OPTICS méthodologie avec 1020 signaux : (a) la méthode t-SNE,(b) la
méthode ACPK

94
Effet du facteur d’amortissement

L’effet du facteur d’amortissement étudié dans cette partie avec la méthodologie AOC-OPTICS
appliquée avec la méthode de réduction de dimension t-SNE et ACPK dans les trois états de bruit avec
0.1b (t), 0.3b (t) et 0.5b (t). La base de données est sélectionnée parmi 51 valeurs, ce qui donne une
base de données de 1020 valeurs. L’amplitude utilisée est égale à A = 0 et une vitesse de rotation fr =25
tr / min.

a b
Figure 4. 9 Effet de l’amortissement, AOC-OPTICS avec 1020 signaux : (a) la méthode t-SNE, (t), (b) la
méthode ACPK

La méthode AOC-OPTICS est appliquée aux signaux de vitesse de rotation et de facteur


d’amortissement. Les résultats de la méthodologie, sont présentés dans les figures 4.8 et 4.9. La
variation de la vitesse de rotation et du facteur d’amortissement ne causent pas l’apparence d’une
deuxième classe, ce qui signifie qu’ils ne peuvent pas différencier entre les signaux sains et les signaux
défectueux, même avec les deux méthodes de réduction de dimension.

Effet de l’amplitude

Dans cette section, nous présentons les résultats obtenus pour les paramètres suivants : méthode
Relief, distance de Manhattan, 𝑀𝑖𝑛𝑃𝑡𝑠= Th/2, 𝜀 = 0,094. Une visualisation 3D est choisie (trois
composantes principales) avec deux méthodes de réduction de dimension (ACPK et t-SNE). En effet,
les résultats 3D donnent une précision de détection de 96,7 % et les résultats 2D couvrent une
précision inférieure à 93,7 %. Les résultats de la simulation BPFO (Ball Pass Frequency Outer) montrent
le défaut détecté à partir du signal n°200, pour deux niveaux de bruit 0.1b(t), 0.3b(t) et signal n°220
pour 0.5b(t) (figures. 4.10 -4.15).

Les résultats obtenus montrent l’efficacité de notre méthodologie utilisée AOC-OPTICS avec deux
méthodes de réduction de dimension ACPK et t-SNE et l’utilisation de la distance Manhattan. La
détection avec 0.1 b(t) et 0.3 b(t) montre 100% de détection avec les deux méthodes de réduction de
dimension, mais avec l’augmentation du niveau de bruit qui affecte la détection, ce qui nous donne
90% dans le cas de 0.5 b (t).

95
a b c
Figure 4. 10 Méthodologie AOC-OPTICS, Effet de l’amplitude pour 0.1b(t) avec t-SNE (a) Signal n°200, (b)
Signal n°220, (c) Signal n°1020

a b c
Figure 4. 11 Méthodologie AOC-OPTICS, Effet d’amplitude 0.1b(t) avec ACPK (a) Signal n°200, (b) Signal
n°220 (c) Signal n°1020

a b c
Figure 4. 12 Méthodologie AOC-OPTICS, Effet d’amplitude 0.3b(t) avec t-SNE (a) Signal n°220, (b) Signal
n°240, (c) Signal n°1020

a b c
Figure 4. 13 Méthodologie AOC-OPTICS, Effet d’amplitude 0.3b(t) avec ACPK (a) Signal n°200, (b) Signal
n°220, (c) Signal n°1020

96
a b c
Figure 4. 14 Méthodologie AOC-OPTICS, Effet d’amplitude 0.5b(t) avec t-SNE (a) Signal n°200, (b) Signal
n°240, (c) Signal n°1020

a b c
Figure 4. 15 Méthodologie AOC-OPTICS, Effet d’amplitude 0.5b(t) avec ACPK (a) Signal n°220, (b) Signal
n°240, (c) Signal n°1020

1.3.5.1. Suivi du défaut

Le suivi commence après la fin de la boucle de détection. Ce qui nous permet de suivre l’état de défauts
dans les roulements et leur évolution dans le temps pour donner une aide à la prise de décision de la
tache de maintenance à effectuer pour l’équipement surveillée.
Les variables de suivi, notées GV, surveillent la croissance des défauts avec l’amplitude variable des
signaux. L’évolution de GV est étudiée pour les trois niveaux de bruit 0.1b (t), 0.3b (t), 0.5b(t), figure
4.16.
La figure 4.16 (a) représenté l’indice de Calinski calculé entre les deux classes. Les valeurs de la courbe
augmentent avec des valeurs d’amplitude croissantes. La valeur de l’indice de Calinski pour 0.1b (t),
est la plus significative et la courbe se situe au-dessus des autres. Pour un niveau de bruit élevé,
l’évolution est linéaire GV1 = 0.438 k + 7.245 (R2 = 0.980), (k représente le nombre d’itérations)
tandis que pour les deux autres niveaux de bruit, l’évolution est exponentielle. ( R2 = 0.977 et R2 =
0.742).
La figure 4.16 (b) représente l’indice de Davies-Bouldin, la courbe est à l’opposé de l’indice de Calinski-
Harabasz, qui diminue avec l’augmentation de l’amplitude des signaux. Les résultats ont observé ici la
courbe 0.1b (t), au-dessus des autres courbes, et commençant près d’un et finissant près de zéro. Pour
les trois niveaux de bruit, la régression est linéaire. Le modèle mathématique est similaire : GV2 =
−0.0236k + 0.954 (R2 = 0.999), GV2 = −0.0239k + 0.997 (R2 = 0.997), GV2 = −0.0252k +
1.064 (R2 = 0.994) respectivement pour 0.1b (t), 0.3b (t), 0.5b(t).

97
La figure 4.16 (c) représente la densité de la classe défectueuse. La densité diminue au cours de
l’augmentation d’amplitude des signaux pour devenir constante et égale à zéro.
La comparaison entre les courbes montre que la densité pour 0,1 b (t) est plus grande que les autres
rapports signal sur bruit. Les évolutions sont exponentielles avec le modèle mathématique GV3 =
1169e−193k (R2 = 0.975), GV3 = 777e−O.147k (R2 = 0.950), GV3 = 809e−0.151k (R2 = 0.720),
0.1b (t), 0.3b (t), 0.5b(t). La corrélation est mauvaise pour un haut niveau de bruit.
La figure 4.16 (d) représentant le contour de la deuxième classe, elle montre l’augmentation du
contour avec l’amplitude des signaux. La comparaison entre le contour et l’indice de Calinski montre
que l’indice de Calinski continue à augmenter avec l’augmentation de nombre d’amplitudes.
Cependant, les valeurs du contour sont similaires pour les niveaux de bruit de faibles amplitudes. Le
contour est pertinent pour un certain niveau d’amplitude, k = 31 pour les faibles niveaux de bruit et
k = 41 pour de niveaux de bruit plus élevés. Les modèles de régression à partir de k=31 sont GV4 =
0.373e−O.154k (R2 = 0.948), GV4 = 0.059eO.240k (R2 = 0.986), GV4 = 0.034e0.215k (R2 = 0.924).
La figure 4.16 (e) représente la distance entre deux classes, les valeurs de distance augmentent avec
l’amplitude. Pendant que la courbe a une forme de trajectoire croissante pour les trois scénarios 0.1b
(t), 0.3b (t) et 0.5b(t). En outre, le paramètre de distance observé par la trajectoire de 0.1b (t), est au-
dessus des autres courbes à la fin, mais initialement, les trois courbes sont conjointes, puis ils
commencent à se séparer de l’amplitude à l’itération k = 31. Un modèle mathématique linéaire peut
être réalisé à partir de k = 31, GV5 = 0.300k − 0.714 (R2 = 0.963), GV5 = 0.146k − 0.434 (R2 =
0.769), GV5 = 0.097k − 0.297 (R2 = 0.698).
100 0,1 b(t) 1
0,3 b(t) 0.9
Davies-Bouldin index

80 0.8
0,5 b(t)
0.7
Calinski- index

60 0.6
0.5
40 0.4
0.3
20 0.2
0.1
0 0
11 16 21 26 31 36 41 46 51 11 16 21 26 31 36 41 46 51
Amplitude Amplitude

a b

1000 8 7
7 6
800 6
Contour

5
Distance

5
600 4
Densité

4
400 3 3

2 2
200
1 1
0 0 0
11 16 21 26 31 36 41 46 51 11 15 19 23 27 31 35 39 43 47 51 11 16 21 26 31 36 41 46 51
Amplitude Amplitude Amplitude

c d e
Figure 4. 16 Méthodologie AOC-OPTICS, Suivi du classe 𝐂𝟏, (a) Calinski-index, (b) Davies-Bouldin index. (c)
Densité, (d) Contour, (e) Distance

98
En résumé, l’indice de Calinski différencie les niveaux de bruit pour toutes les amplitudes. Cependant,
le modèle de régression mathématique est différent. Pour les faibles niveaux de bruit, un modèle
linéaire est intéressant, tandis que pour les niveaux de bruit élevés, le modèle exponentiel est préféré.
L’indice de Calinski est au contraire peu influencé par le niveau de bruit, le modèle de régression
linéaire est donc similaire. Cela peut montrer l’importance de l’indice de Calinski, qui peut séparer les
courbes de différents scénarios, la valeur commence de zéro et augmente directement avec
l’amplitude, tandis que le paramètre de contour augmente lentement avec l’amplitude. Les
paramètres, Densité et Distance, ont des valeurs proches de 0 soit pour les faibles amplitudes, soit
pour les fortes amplitudes. On déduit que ces deux paramètres sont opposés et ils ont un lien direct
avec l’amplitude. Les évolutions ne sont visibles que pour des plages d’amplitudes. Selon ces
simulations, les indices de Calinski et de Davies Bouldin sont préférés.

Résumé de l’investigation numérique pour IRT-OPTICS et AOC-


OPTICS
Th
Cette investigation numérique a permis de fixer les paramètres internes OPTICS, , (𝑀𝑖𝑛𝑃𝑡𝑠 = 2
) et
d’optimiser les méthodes impliquées dans le processus AOC-OPTICS (méthode Relief, t-SNE, distance
de Manhattan).

Les deux méthodologies IRT-OPTICS et AOC-OPTICS appliquées sur la base de données numériques
montrent une efficacité dans la détection des défauts dans les roulements.

Investigation expérimentale
Bancs d’essais

La validation expérimentale des deux méthodologies IRT-OPTICS et AOC-OPTICS a été faite à


l’Université de Reims Champagne-Ardenne en France sur deux modules d’essais diffèrents. Le premier
module utilise un roulement avec un défaut de différentes tailles créées artificiellement. Le deuxième
module est un banc de fatigue sur lequel est monté le roulement à surveiller et dégradé naturellement.
Pour le type de défaut créé artificiellement le banc d’essai de la figure 4.17 est équipé d’un moteur
électrique qui délivre une puissance maximale de 10 kW par l’intermédiaire d’un arbre supporté par
deux roulements : un roulement à billes 6206 sain et l’autre à rouleaux N.206.E. G15, qui sera dégradé.
La rotation est contrôlée par un variateur de vitesse. Un actionneur via un câble en acier est utilisé
pour charger l’arbre radialement. Les défauts sont créés par un stylo de gravure sur la bague extérieure
du roulement à rouleaux. Ces défauts varient légèrement les uns par rapport aux autres et leur taille
est mesurée à l’aide de la pâte PlastiformTM. Les différentes tailles de défauts sont indiquées dans le
Tableau 4.8. Le profil résultant est caractérisé en termes de rugosité à l’aide d’un profilomètre Taylor-
Hobson Subtronic 3P. L’acquisition des signaux vibratoires est effectuée à l’aide d’un accéléromètre
piézo-électrique placé radialement sur le roulement à rouleaux. Les signaux sont collectés avec une
fréquence d’échantillonnage de 51200 Hz par un collecteur de données OROS OR34.

99
a b

c d
Figure 4. 17 (a) Banc d’essais, (b) Roulement à rouleaux N.206.E. G15,(c) exemple de défaut et (d)
profilomètre avec pâte PlastiformTM

Pour le type de défaut réel, une validation est réalisée sur un banc de fatigue de roulement à butées à
billes. Un moteur synchrone entraîne un arbre en rotation à 1800 tours/minute. Un palier reçoit l’une
des deux bagues de la butée examinée. La deuxième bague de la butée, est chargée par un vérin à
30kN. Deux accéléromètres, placés radialement et axialement, sont disposés sur le châssis logeant une
des butées. Le système est entraîné en mouvement par le moteur jusqu’à ce qu’un défaut d’écaillage
apparaisse sur la piste de la bague de butée. À cette phase, nous contrôlons régulièrement la taille du
défaut d’écaillage par un contrôle visuel. La butée testée est un roulement à billes de référence RSB
51207. Il comporte 12 billes et a une charge dynamique de 39000N. Les signaux sont collectés avec
8192 points et une fréquence d’échantillonnage de 51.2khz pour obtenir un nombre de cycles
significatif. La fréquence d’enregistrement était variable pour les 50 premières heures de
fonctionnement. La fréquence d’enregistrement variait de 10h, 5h, et 3h. Après 50 heures de
fonctionnement un signal était enregistré toutes les 3 heures jusqu’à 98 heures de fonctionnement.
De 107 heures de fonctionnement jusqu’à 115 heures, un signal est enregistré toutes les heures. Le
banc a été démonté après 114 heures pour inspection et un défaut de 2,47 mm a été mesuré, la
fréquence d’enregistrement a été accélérée après 115 heures ; un signal est enregistré toutes les 30
minutes puis toutes les 5 minutes. Le banc a été démonté 8 fois au total, la première fois à 114 heures
où un défaut de 2,47 mm² a été découvert, puis à t = 116h le diamètre des défauts s’est élargi pour
atteindre 22,78 mm² ; à t = 116h20 minutes le diamètre des défauts était de 28,38 mm², à t = 117h10
min le diamètre des défauts était de 53,5 mm², à t = 118h25 minutes où le diamètre des défauts était
de 104,6 mm. Après chaque démontage, le test a été effectué dans les mêmes conditions initiales. La
figure 4.18 montre l’évolution de défauts après 9 heures et 118 heures.

100
a b
Figure 4. 18 (a) défaut après 9 heures, (b) défaut après 118 heures

Tableau 4. 8 Dimensions des défauts : rugosité arithmétique (Ra) et une rugosité totale (Rt) pour le banc
d’essai ( figure 4.17)

Défauts Sain n°1 n°2 n°3 n°4 n°5 n°6 n°7 n°8
Rt(μm) – 2.42 3.00 8.25 10.50 10.55 18.17 18.67 21.42
Ra(μm) – 0.33 0.41 0.73 1.32 1.52 1.82 2.36 2.97
Largeur(mm) – 0.16 0.21 0.45 0.74 1.09 1.78 2.03 2.32

Validation expérimentale de la méthodologie IRT-OPTICS


Création de données expérimentales

La méthodologie IRT-OPTICS a été testée sur la base de données créée artificiellement. Pour chaque
taille de défaut, des charges différentes (trois charges différentes de 100, 160 et 250 daN) et des
vitesses de rotation différentes (1405, 1465 et 1540 tr/min) sont appliquées. Les indicateurs des
fréquences sont calculés en exploitant les indicateurs du roulement (roulement à rouleaux N.206.E.
G15) et la cinématique du système. Pour chaque condition de charge et de vitesse et pour chaque taille
de défaut, 16 signaux avec 6400 échantillons sont collectés successivement. La base de données
contient 432 signaux (16×9×3). Les mêmes indicateurs utilisés dans la simulation sont appliqués ici.
Ensuite, comme dans le cas de la simulation, ACP et ACPK sont utilisés pour la réduction de la
dimension.

Effet de l’amplitude

Les figures 4.19 et 4.20 montrent le résultat de la mise en œuvre de la méthodologie proposée avec
les deux méthodes de réduction de dimension l’ACP et de ACPK respectivement. Après initialisation
avec 16 premiers signaux, la boucle de détection démarre. Malgré la variation des paramètres de la
cinématique de la machine et la perturbation de l’évolution des indicateurs, la mise en œuvre de la
méthode permet de détecter l’initialisation du défaut avec une excellente précision (100%). Les
résultats montrent que la méthode peut détecter un petit changement d’état du roulement. Les
résultats de la classification ne sont pas sensiblement affectés par la variation de la cinématique et des
indicateurs dynamiques de la machine (charge et vitesse), ce qui prouve la robustesse de la méthode.

101
a b c
Figure 4. 19 Méthodologie IRT-OPTICS, Validation expérimentale avec ACPK (a) Signal n°48, (b) Signal
n°49, (b) Signal n°432

a b c
Figure 4. 20 Méthodologie IRT-OPTICS, Validation expérimentale avec ACP(a) Signal n°48, (b) Signal n°49,
(b) Signal n°432

2.2.2.1. Suivi du défaut expérimental par la méthodologie IRT-OPTICS

6.0 70 14

60 12
5.5
50 10
5.0
Contour
Distance

40 8
Densité

4.5 30 6

20 4
4.0
10 2

3.5 0 0
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
Numéro de défaut Numéro de défaut Numéro de défaut

a b c
Figure 4. 21 Méthodologie IRT-OPTICS, Suivi de la classe 𝐂𝟐 détecté : évolution de (a) la distance, (b) du
contour et (c) de la densité

L’étape "suivi" commence après la détection de la classe (C2) qui représente le défaut. La figure 4.21
montre l’évolution des paramètres (distance, contour et densité) en fonction de la taille du défaut.
Pour chaque taille de défaut, nous avons 16 signaux pour 3 conditions de charge ou de vitesse, soit 48

102
signaux pour une taille de défaut. La moyenne et l’écart-type sont calculés et présentés dans la figure
4.21. La figure 4.21 (a), montre que la distance augmente jusqu’au défaut n°6 et se stabilise ensuite.
La figure. 4.21(b) montre que le contour augmente en fonction de la taille du défaut. Ceci reflète une
dispersion du nuage de points due à la gravité du défaut. La densité diminue et converge vers la valeur
0 (figure. 4.21 (c)). Les trois évolutions (figure. 4.21 a, b, c) montrent que les écarts types sont faibles
pour chaque défaut. Ainsi, les variations de la charge et de la vitesse de rotation ont une légère
influence sur les résultats. Cela confirme la non-influence de ces variables. Cependant, il convient de
noter une singularité pour le paramètre de densité sur le premier défaut. Le coefficient de variation
est supérieur à 200%. Ceci est dû à l’intégration itérative des signaux. Le suivi commence avec un signal
qui donne une densité de valeur élevée, puis la densité diminue rapidement avec l’intégration des
autres signaux.

Parmi ces trois paramètres, le contour semble le plus pertinent car son évolution augmente avec la
taille du défaut et n’est pas sensible aux variations de charge et de vitesse.

Comparaison IRT-OPTICS avec la méthode RT-OPTICS

La méthode proposée est comparée à la méthode décrite par [2]. Cette étude propose un algorithme
qui peut détecter et surveiller l’état de dégradation naturelle de la bague extérieure d’un roulement.
Les résultats de la comparaison des classifications sont présentés à la figure 4.22 avec ACP et à la figure
4.23 avec ACPK.

a b

c d
Figure 4. 22. Méthode expérimentale proposée par RT-OPTICS avec ACP (a) Signal n°48, (b) Signal n°49, (c)
Signal n°50, (d) Signal n°432

103
La comparaison entre les deux méthodes montre que la méthode proposée par l’extraction de treize
indicateurs est plus fiable et plus précise que l’utilisation de deux indicateurs d’extraction seulement.
En fait, RT-OPTICS détecte le défaut sur le 50éme signal. La principale explication réside dans les deux
extractions de indicateurs, qui ne couvrent pas entièrement la matrice de données des signaux. Par
conséquent, la surveillance commence au 50éme signal pour RT-OPTICS, figure. 4.20 et 4.21 (c, d).

a b

c d
Figure 4. 23. Méthode expérimentale proposée par RT-OPTICS avec ACPK (a) Signal n°48, (b) Signal n°49,
(c) Signal n°50, (d) Signal n°432

IRT-OPTICS RT-OPTICS IRT-OPTICS RT-OPTICS


7 IRT-OPTICS RT-OPTICS
60
6
6
50
5
5
Distance

Contour

Densité

40 4
4
30 3
3

2 20 2

1 10 1
0 0
0
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8
Défaut Défaut Défaut

a b c
Figure 4. 24 Comparaison du suivi de défaut par les évolutions, (a) de la distance, (b) du contour, (c) de la
densité

104
La figure 4.24 (a, b, c) montre l’évolution des paramètres (distance, contour et densité) obtenus par
les deux méthodologies, RT-OPTICS et IRT-OPTICS. La distance est plus importante avec la méthode
IRT-OPTICS et c’est elle qui augmente le plus (figure. 4.24 a). Dans la figure 4.24(b), le contour de la
deuxième classe a une augmentation progressive dès le début pour les deux méthodes. Cependant,
l’IRT-OPTICS est plus sensible, et l’évolution est exponentielle. La densité diminue pour l’IRT et la RT
OPTICS (figure. 4.24 c). L’évolution converge plus rapidement vers zéro par la méthode RT-OPTICS. Ce
fait ne permet pas de suivre la valeur par défaut avec précision.

Ces trois paramètres sont plus sensibles à la méthode proposée, IRT-OPTICS. Elle permet d’améliorer
le suivi de la classe de défaut (C2).

Le Tableau 4.9 résume les résultats obtenus par les deux méthodologies. La comparaison entre les
résultats obtenus par les deux méthodologies montre que l’utilisation de kurtosis et la RMS (dans la
méthode RT-OPTICS) est bonne pour détecter le deuxième classe ou le défaut de roulement mais
qu’elle est détectée tardivement par rapport à notre méthodologie qui utilise treize indicateurs de
indicateurs. En d’autres termes, l’utilisation de l’extraction de treize indicateurs rend la détection plus
efficace et plus précise. Les composantes du 49éme signal sont considérées comme du bruit (deuxième
classe non détectée) dans RT-OPTICS alors que l’extraction de treize indicateurs permet de détecter la
défaillance au même instant ce qui est le 48éme signal. Le suivi des indicateurs (distance et contour) est
plus sensible avec l’IRT-OPTICS.

Tableau 4. 9 Comparaison entre IRT-OPTICS et RT-OPTICS

IRT-OPTICS RT-OPTICS

Initialisation OUI Indéfinie

Détection ++ +

Suivi ++ +

Sensibilité à la charge Non OUI

Sensibilité à la vitesse Non OUI

Validation expérimentale de la méthodologie AOC-OPTICS

La validation de la méthodologie AOC-OPTICS est faite sur les deux bases de données créées
artificiellement et naturellement.

Détection des défauts artificiels

La base de données recueillie à partir de défauts artificiels est composée d’une condition saine et de 8
conditions avec des défauts croissants. 10 conditions de fonctionnement aléatoires sont appliquées
parmi 5 charges allant de 100 à 220 daN, avec un pas de 30 daN, et 5 vitesses de rotation allant de
1405 à 1560 tr/min avec un pas de 50 tr/min. Le nombre de combinaisons est de 90 (k =90). Pour
chaque combinaison, 8 signaux sont collectés (n = 8) avec 12800 échantillons. La base de données
totale est constituée de 720 signaux. Les entrées sont Δt = 1 (valeur par défaut), Tini = 10, n = 8.
Ainsi, à chaque itération k, 8 nouveaux signaux intègrent l’algorithme. 80 signaux lancent le processus
de suivi. Car d’après les 720 signaux, les 80 premiers sont des signaux sains et les autres sont des
signaux de défauts. La base de données créée à partir de 1 état sain et 8 états de défauts

105
Après la phase d’initialisation (Tini = 16), la phase de détection se déroule jusqu’à la détection d’une
deuxième classe. Cette détection est effectuée pour l’itération k = 11. Les paramètres d’entrée sont
Th
𝑀𝑖𝑛𝑃𝑡𝑠 = 2
= 4 et 𝜖 = 0.12 (Voir équation 3.4). Les résultats de la méthode AOC-OPTICS sont
représentés dans les figures 4.25 et 4.26. La classe C2 apparue à l’itération 11 est confirmée par les
itérations suivantes. Malgré la variation des charges et de la vitesse, la précision est de 100 %. Les
résultats de notre méthode permettent de détecter une petite variation de l’état du roulement. Tous
ces résultats peuvent démontrer la robustesse de la méthodologie utilisée.

a b c
Figure 4. 25 Méthodologie AOC-OPTICS, Validation expérimentale avec t-SNE (a) Signal n°80-Sain, (b)
Signal n°88-Défaut, (c) Signal n°720-Défaut

a b c
Figure 4. 26 Méthodologie AOC-OPTICS, Validation expérimentale avec KPCA (a) Signal n°80-Sain, (b)
Signal n°88-Défaut, (c) Signal n°720-Défaut

2.3.1.1. Suivi des défauts artificiels

2000 1
1800
1600 0.8
Davies-Bouldin index

1400
Calinski index

1200 0.6
1000
800 0.4
600
400 0.2
200
0 0
10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90
Amplitude Amplitude
a b

106
160 18 6
140
15 5
120
100 12 4
Densité

Distance
80

Contour
9 3
60
6 2
40
20 3 1
0 0
0
10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90
10 20 30 40 50 60 70 80 90
Amplitude Amplitude
Amplitude
c d e
Figure 4. 27 Méthodologie AOC-OPTICS, Suivi de la classe détectée : évolution de (a) l’indice de Calinski,
(b) l’indice de Davies-Bouldin, (c) de la densité, (d) du contour, (e)de la distance

Le suivi commence à partir de l’itération 11 jusqu’à l’itération 90 pour les 5 paramètres : indice de
Calinski et Davies-Bouldin, densité, contour, distance, figure 4.27. Le comportement de ces variables
est différent et reste similaire aux comportements établis lors de la simulation. L’indice de Calinski
augmente avec la taille des défauts. À l’itération 65, l’indice a une évolution exponentielle sous la
forme mathématique GV1 = 161.13e0.084k (R2 = 0.982), figure 4.27 (a). L’indice de Davies-Bouldin
diminue proportionnellement au défaut, figure 4.27 (b). Dans ce cas, nous pouvons proposer une
régression linéaire GV2 = −0.0107k + 0.947 (R2 = 0.994). La densité diminue avec l’augmentation
des valeurs d’amplitude pour se situer autour de zéro du signal numéro soixante à quatre-vingt-dix, le
modèle mathématique est GV3 = 197.15. exp(−0.095k) (R2 = 0.940), figure 4.27 (c). Le contour
montre deux tendances, figure 4.27 (d). Le contour évolue proportionnellement pour les 60 premières
itérations avec une faible pente, GV5 = 0.014k − 0.0697 (R2 = 0.934). A partir de la 60e itération,
l’évolution reste linéaire mais augmente fortement, GV4 = 0.4791k − 3.518 (R2 = 0.904). La
courbe de distance augmente avec l’augmentation des valeurs d’amplitude. L’évolution est
exponentielle GV5 = 0.225e0.039k (R2 = 0.828). Toutefois, la monotonie n’est pas pertinente. Il y a
beaucoup de variabilité autour de la tendance moyenne, figure 4.27 (e).

En comparant l’évolution de ces indicateurs, l’indice de Calinski et le contour montrent quelques


singularités dans l’évolution à l’itération 60 correspondant au défaut 5. Ces paramètres indiquent le
stade de dégradation de la gravité dans le roulement. L’indice de Davies est l’indice le plus corrélé au
nombre d’itérations (R2 = 0.994). En général, ces indicateurs permettent de faire un pronostic sur
l’évolution de ces paramètres avec les itérations.

Détection du défaut naturel

La base de données impliquent l’évolution d’un défaut naturel contient 274 signaux (69 signaux * 4).
La méthode AOC-OPTICS est appliquée. Les entrées sont Δt = 1 (36), Tini = 8, n = 4. Ainsi, à chaque
itération k, 4 nouveaux signaux intègrent l’algorithme. 137 signaux lancent le processus de suivi le
défaut.

La méthode dynamique automatisée AOC-OPTICS est représentée dans la figure 4.28. Après
initialisation avec la matrice initiale (Tini = 8), la boucle de détection démarre, cette détection est
faite pour le signal 137, les paramètres d’entrée sont 𝑀𝑖𝑛𝑃𝑡𝑠 = Th /2 = 4 et 𝜖 = 0.219. La méthode
proposée nous permet de détecter le défaut d’initialisation avec une précision de 100%. Les résultats
de notre méthodologie permettent de détecter une infime variation de l’état du roulement.

107
a b c
Figure 4. 28 Méthodologie AOC-OPTICS, Validation expérimentale avec t-SNE. (a) Signal n°136-Sain (111 h
de fonctionnement), (b) Signal n°140-Défaut (112h), (c) Signal n°272-Défaut (118h25)

La validation sur ces données conduit à présenter le défaut d’une façon évolutive. Comme avec les
données numériques et expérimentaux intégrant les défauts créés artificiellement, notre algorithme
montre une efficacité à détecter le défaut avec précision de 100%.

2.3.2.1. Suivi du défaut naturel

120 1

100
0.8
Davies-Bouldin-index

80
Calinski-index

0.6
60
0.4
40

0.2
20

0 0
35 52 69 35 52 69
Amplitude Amplitude

a b

0.3 8
70

0.25 7
60

0.2 50 6
Contour

Distance
Densité

0.15 40 5

0.1 30 4

0.05 20 3

0 10 2
35 52 69 35 52 69 35 52 69
Amplitude Amplitude Amplitude
c d e
Figure 4. 29. Méthodologie AOC-OPTICS, Suivi de la classe 𝐂𝟐, (a) Calinski index, (b) Davies-Bouldin index,
(c) Densité, (d)Contour, (e) Distance

108
Le suivi commence à partir de l’itération 35 jusqu’à l’itération 67 pour les 5 paramètres : indice de
Calinski et Davies-Bouldin, densité, contour, distance, figure 4.29. Le comportement de ces variables
est différent et reste similaire aux comportements établis lors de la simulation. L’indice de Calinski
augmente avec la taille des défauts, avec une évolution exponentielle sous la forme mathématique
GV1 = 848.13e0.076k (R2 = 0.975), figure 4.29 (a). L’indice de Davies-Bouldin diminue
proportionnellement au défaut, figure 4.29 (b). Dans ce cas, nous pouvons proposer une régression
linéaire GV2 = −0.0315k + 1.15 (R2 = 0.975). La densité diminuait avec l’augmentation des valeurs
d’amplitude pour se situer autour de zéro du signal numéro trente-cinq à cinquante-huit, le modèle
mathématique est GV3 = 0.319. exp(−0.0108k) (R2 = 0.628), figure 4.29 (c). Le contour montre
deux tendances, figure 4.29(d). Le contour évolue proportionnellement avec la taille de défauts,
GV4 = 1.41k + 25.997 (R2 = 0.934). La courbe de distance augmente avec l’augmentation des
valeurs d’amplitude d’une façon zigzag. L’évolution est exponentielle GV5 = 3.323e0.018k (R2 =
0.357), figure 4.29 (d).Toutefois, la monotonie n’est pas pertinente. Il y a beaucoup de variabilité
autour de la tendance moyenne, figure 4.29 (e).

En comparant l’évolution de ces indicateurs, les indices de Calinski et Davies Bouldin montrent leur
pertinence, et indiquent le stade de dégradation dans le roulement. L’indice de Davies est Davies
Bouldin l’indice le plus corrélé au nombre d’itérations (R2 = 0.975). En général, ces indicateurs
permettent de faire un pronostic sur l’évolution de ces paramètres avec les itérations. La surveillance
des machines par analyse vibratoire occupe une place prépondérante dans le diagnostic et le pronostic
de défauts des machines tournantes. Le pronostic et le suivi de défauts dans le cadre de la surveillance
donne une idée générale sur le fonctionnement des équipements du système et modèle d’évolution
de la dégradation.

Comparaison des deux méthodologies


IRT-OPTICS

La méthodologie IRT-OPTICS, utilise l’extraction d’indicateurs combinée à une classification dynamique


basée sur l’algorithme de densité. Trois boucles composent la surveillance : l’initialisation, la détection
et le suivi des défauts. Cette approche a été validée numériquement et expérimentalement. La
méthodologie IRT-OPTICS apporte plusieurs améliorations à la méthode RT-OPTICS :

 Dans la validation expérimentale, la performance de la méthodologie n’est pas affectée par les
variations de charge et de vitesse. Cette méthodologie n’est pas non plus sensible aux
variations de l’amortissement.
 Une phase d’initialisation est introduite en supposant un roulement en bon état.
 La détection du défaut est effectuée avec une grande précision par rapport aux méthodes de
classification dynamique de la littérature.

Limites de IRT-OPTICS

 Cette méthodologie utilise treize indicateurs bien ciblés pour donner de bons résultats, mais
pour cela il faut trouver une méthode qui puisse sélectionner les indicateurs les plus pertinents
en vue de la détection de défauts.

109
 Les paramètres utilisés dans IRT-OPTICS comme  et 𝑀𝑖𝑛𝑃𝑡𝑠 ne sont pas automatisés et
nécessitent plusieurs simulations pour choisir les meilleurs.
Pour répondre à ces limites, une nouvelle méthodologie AOC-OPTICS a été proposée pour
l’automatisation et l’optimisation des valeurs de paramètre et du choix des indicateurs.

AOC-OPTICS

C’est une méthodologie automatique en ligne pour surveiller les roulements à billes en optimisant les
paramètres internes de la méthode OPTICS et l’étape de réduction des dimensions. La surveillance
dynamique AOC-OPTICS se divise en trois phases : l’initialisation, la détection et le suivi du défaut. La
méthodologie est confrontée à une évolution simulée du défaut puis à des données expérimentales.
La détection atteint une précision de 100%. Le suivi est assuré par des valeurs géométriques dont la
tendance suit des modèles mathématiques linéaires ou exponentiels avec des coefficients de
corrélation allant jusqu'à 0,994. Cette méthodologie nous apporte de nombreuses améliorations :

 Cette méthodologie automatisée détermine les meilleurs paramètres à utiliser dans la


classification.
 La variation de la vitesse et du facteur d’amortissement ne peut pas conduire à la découverte
de la dérive du système. Seule l’amplitude permet de détecter l’état défectueux.
 La méthode Relief est efficace par rapport au Khi carré, utilisée pour supprimer les indicateurs
inutiles, ce qui rend la classification plus efficace.
 La densité, l’indice de Calinski et l’indice Davies-Bouldin, sont plus efficaces que les autres
paramètres (distance et contour), pour suivre la trajectoire de la croissance du défaut.

110
CONCLUSION
L’objectif de ce chapitre est de valider les deux méthodologies IRT-OPTICS et AOC-OPTICS proposées
sur trois bases de données (numérique, expérimentale avec des défauts artificiels, expérimentale avec
une croissance naturelle de défaut).

Pour l’algorithme IRT-OPTICS, treize indicateurs furent utilisés pour détecter le défaut dans la bague
intérieure. Les paramètres utilisés dans OPTICS furent choisis arbitrairement : 𝑀𝑖𝑛𝑃𝑡𝑠 égale à trois et
 égale à 0.9. Après la réduction de dimension avec deux différentes méthodes ACP et ACPK, il est
permis de conclure que ACPK améliore la séparation entre les deux classes, dites saine et défectueuse.
Après la détection de défauts, le suivi commence à surveiller l’état de défaillance avec trois indicateurs
: la densité, la distance et le contour.

La deuxième méthodologie AOC-OPTICS automatise les paramètres OPTICS  et 𝑀𝑖𝑛𝑃𝑡𝑠 , et optimise


le choix de la distance (distance Manhattan), la sélection des paramètres (t-SNE). La sélection des
indicateurs est réalisée par deux méthodes Relief et Khi- carré. Relief donne de meilleurs résultats que
Khi-Carrée. Les résultats de la classification dynamique ont permis ensuite d’extraire les indicateurs
géométriques des classes à chaque nouvelle observation puis de suivre son évolution par rapport aux
valeurs par défaut. Cinq différents indicateurs ont été analysés : indice de Calinski, indice de Davies-
Bouldin, densité, distance et contour. Le suivi de changement de ces indicateurs par rapport au défaut,
permet de suivre la dégradation d’un roulement ou de distinguer un changement qui est dû à
l’évolution du défaut de celui d’une augmentation de la charge. Les indices Davies-Bouldin et Calinski
sont les plus intéressants car ils permettent de suivre l’état de dégradation d’une machine plus
efficacement que les autres.

111
CONCLUSION GENERALE

112
Les roulements sont les éléments les plus utilisés dans les machines tournantes. En tant qu’élément
critique, il supporte la plus grande partie de la charge pendant le fonctionnement des machines
tournantes. En cas de défaillance d’un roulement, de graves problèmes surviennent, qui entraînent à
leur tour une diminution de l’efficacité de la production et d’importantes pertes économiques. La
défaillance d’un roulement produit des vibrations lorsqu’un composant du roulement tombe en
panne. La nature transitoire et périodique des vibrations mesurées donne des informations
importantes sur la durée de vie du roulement. Néanmoins, les vibrations mesurées sont souvent
cachées par des bruits blancs associés à une résonance des structures à des fréquences élevées. Cette
situation crée donc une difficulté importante pour l’identification de ces vibrations dans le signal
mesuré. Les méthodes de détection habituelles des défauts de roulement sont basées sur l’analyse
des signaux vibratoires dans les domaines temporel et fréquentiel. L’analyse statistique du signal
temporel renseigne sur le degré d’énergie du signal vibratoire et sur la répartition de la densité de
probabilité en amplitude.

La littérature présente plusieurs techniques de détection et de diagnostic des défauts de roulements,


mais il est toujours difficile de mettre en œuvre un système fiable de surveillance des conditions pour
les applications industrielles réelles en présence de structures de roulements et de conditions de
fonctionnement bruyantes complexes. Ce travail consiste en une contribution à la détection
intelligente des défauts dans les machines tournantes. La stratégie consiste à développer des
techniques plus fiables à chaque phase de traitement pour améliorer la fiabilité de la surveillance des
conditions de fonctionnement.

Cette thèse s’intéresse à la possibilité de diagnostiquer les défauts mécaniques à l’aide d’algorithmes
de classification dynamique. De surcroît, la majorité des applications de ces algorithmes sont des
applications statiques qui produisent des résultats de classification en fonction du choix du nombre de
classes, de la taille des bases de données étudiées et du système d’apprentissage, ce qui n’est pas
évident pour le diagnostic automatisé des machines tournantes.

Le projet a principalement pour objectif de concevoir un algorithme dynamique avec fixation de


nombre de classes en deux classes, dites saine et défectueuse. La solution que nous proposons se base
sur la méthode OPTICS. Dans notre évaluation expérimentale, la méthode de classification dynamique
nous a permis d’obtenir de meilleurs résultats de diagnostic et une réduction du temps de traitement.
La méthode envisagée a permis de différencier la détection des défauts, avec la variation des deux
paramètres de fonctionnement (vitesse et charge) de la machine. L’avantage principal de cette
méthode est la détection rapide et automatique des défauts sans influence des indicateurs de la
machine, ce qui la rend utile pour la maintenance industrielle.

Le premier chapitre présente de manière générique les différents types de roulements, et apprécie
leur importance et la criticité de leurs applications. Les défaillances pouvant affecter leur
fonctionnement sont présentées. Pour un fonctionnement optimal de ces machines, une surveillance
accrue de leurs conditions de fonctionnement est souvent nécessaire, pour cela plusieurs techniques
existent, dont beaucoup ont été présentées avec une attention particulière pour les techniques basées
sur l’analyse vibratoire. Par la suite, une synthèse bibliographique a été présentée, faisant état de l’art
du diagnostic des machines tournantes, qui a permis de prendre conscience de la quantité
d’informations qui peuvent être recueillies sur l’environnement de ces machines. Cette quantité
d’informations pose également un problème en ce qui concerne l’automatisation de leur surveillance.
Cette problématique s’exprime dans la détermination des informations pertinentes nécessaires à la

113
reconnaissance de défaillances spécifiques, lesquelles peuvent affecter une machine spécifique, dans
les conditions de fonctionnement déterminées.

Le deuxième chapitre est dédié à présenter la démarche de diagnostic par reconnaissance de formes.
Dans ce chapitre, quatre types de reconnaissance de formes ont été présentés. Il s’agit des méthodes
de reconnaissance de formes statiques pour les formes statiques, des méthodes de reconnaissance de
formes dynamiques pour les formes statiques, des méthodes de reconnaissance de formes statiques
pour les formes dynamiques et des méthodes de reconnaissance de formes dynamiques pour les
formes dynamiques. Pour choisir le type de méthode de reconnaissance de formes, il faut prendre en
compte différents éléments tels que les données et l’environnement du système (statique,
dynamique). Le principe de plusieurs méthodes de reconnaissance de formes dynamiques ainsi que de
plusieurs méthodes de reconnaissance de formes dynamiques est également détaillé. Toutes ces
méthodes font partie des axes de recherche et de développement présentées au sein de cette thèse.
En effet, la détection des défauts et le suivi de l’évolution des systèmes, c’est-à-dire des systèmes dont
les indicateurs changent avec le temps, nécessitant l’utilisation de méthodes de classification
dynamique, sont au centre de ces recherches. Ces méthodes sont capables de suivre l’évolution des
indicateurs des systèmes évolutifs et d’adapter le classifieur et les classes afin de maintenir les
performances du classifieur après l’évolution du système. Par ailleurs, cette étude a permis de
constater que les méthodes de classification utilisées pour établir des diagnostics automatiques et
dynamiques dans les machines tournantes ont été particulièrement utilisées pour leur qualité de
séparation de données, qui puissent expliquer la relation entre les données et leurs classes. Avec la
mise en place de la théorie de la classification dynamique, de nouvelles méthodes de surveillance des
machines tournantes ont pu être mises en œuvre. La méthode OPTICS a été choisie car elle permet de
mettre en évidence la présence de différentes zones de densités différentes sur les données de la
deuxième classe. Les différentes zones constituent les différents stades de défaillance des roulements.
Elles constituent de ce fait de meilleurs indicateurs pour le suivi de la sévérité des défauts dans le
temps.

Dans le troisième chapitre, la méthode de reconnaissance de formes dynamiques destinée au


diagnostic et à la surveillance des roulements est exposée, tout d’abord, en présentant l’architecture
générale de la méthode proposée, puis en détaillant chaque technique utilisée dans l’étape
d’extraction et de sélection. Pour la partie classification, une présentation des méthodes développées
pour la surveillance des roulements a été faite par deux processus. Le premier processus proposé, IRT-
OPTICS, était inspirée de l’algorithme RT-OPTICS auquel trois boucles sont ajoutées “initialisation,
détection et suivi ‘’. La première boucle est la phase d’initialisation de la classification qui consiste à
extraire les indicateurs et fixer le nombre avant de commencer la deuxième boucle de la détection. La
deuxième boucle a pour but de détecter le défaut, avec pour condition la détection de la deuxième
classe, la classification s’arrête et la troisième boucle commence, sinon elle reprend les étapes de la
deuxième boucle avec de nouveaux signaux arrivants. La troisième boucle est la surveillance de défaut
qui permet de suivre l’évolution avec le temps ce qui donne une idée générale sur le statut de la
machine, pour remplacer l’équipement défectueux. L’algorithme est devenu dynamique grâce à ces
trois boucles et leur fonctionnement. Cependant, la méthode IRT-OPTICS nécessite des paramètres
(MinPts et ), aussi des indicateurs choisis manuellement. Nous avons ensuite proposé une
automatisation dans une deuxième méthode, AOC-OPTICS, qui est une version de IRT-OPTICS adaptée
au traitement en ligne et capable de classer correctement d’une façon automatique et optimisée sans
le besoin d’introduction des paramètres.

114
Le quatrième chapitre a pour objectif de valider les différentes méthodes proposées avec des bases de
données issues d’un modèle numérique, d’un banc expérimental avec des défauts artificiels et d’un
deuxième banc expérimental générant des défauts naturels. La validation a permis de visualiser
l’évolution de différentes classes, et de les différencier entre classe saine et classe défectueuse, même
en présence de différentes charges et vitesses. Ce principe permet de démontrer les avantages des
méthodes développées. Enfin une étude comparative des deux méthodologies présente les avantages
et les inconvénients de chaque méthodologie. La méthodologie AOC-OPTICS fut conçue pour améliorer
la méthodologie IRT-OPTICS en rendant la détermination des paramètres de l’algorithme OPTICS et la
sélection des indicateurs automatique aboutissant à un processus de surveillance intelligent.

PERSPECTIVES
Cette thèse contribue à la surveillance des défaillances des machines tournantes par analyse vibratoire
et processus de classification. De nombreuses perspectives en découlent.

Les techniques de détection des défauts de roulements pourrait s’appliquer sur d’autres composants
et/ou d’autres systèmes mécaniques tels que le stator et le rotor par exemple, une étude faite par
[241] montre que 37% de défaut se déroule sur le stator et 10% sur le rotor. Egalement, il serait
intéressant de faire des recherches plus approfondies sur le diagnostic des défauts de roulements par
les méthodes d’intelligence artificielle. L’idée est de mettre en œuvre les outils de surveillance
développés pour l’utilisation dans la surveillance industrielle réelle, ce qui permet d’améliorer la
qualité de la production et de réduire les coûts.

Également il est possible d’étudier l’effet de la profondeur du défaut sur les signaux de vibration ainsi
que la combinaison des changements aléatoires et en forme du profil de surface. [242] étudie plus en
détail l’effet de différentes tailles de défaut sur roulement. En fait, les études existantes ont fait une
grande exploration dans la réalisation de diagnostic quantitatif précis des roulements, mais il reste
encore un long chemin à parcourir.

Il serait intéressant de développer un modèle de simulation de la machine tournantes, qui combine


l’engrenage, roulement, courroie de transmission, afin d’étudier le système dans son ensemble. L’une
des pistes futures de recherches est l’écaillage de la bague intérieure du roulement, c’est la forme
principale de manifestation des défauts de roulement à un stade précoce.

Une des perspectives peut toucher également l’intégration d’un jumeau numérique dans le processus
de surveillance. Ce jumeau numérique pourrait apporter de la fiabilité dans les diagnostics et une
estimation de la durée de vie résiduelle. Un jumeau numérique est un modèle virtuel qui reflète un
objet ou un processus physique tout au long de son cycle de vie. Offrant un pont en temps quasi réel
entre le monde physique et le monde numérique, cette technologie permet de surveiller et de
contrôler à distance des équipements et des systèmes. Enfin, elle peut exécuter des modèles de
simulation pour tester et prévoir les changements actives et le processus dans différents scénarios. En
exploitant les jumeaux numériques, les entreprises peuvent réaliser des bénéfices substantiels tels que
l’amélioration des opérations, l’innovation de produits et de services, et une mise sur le marché plus
rapide.

115
BIBLIOGRAPHIE
[1] Kerroumi, Sanaa. "Extraction des paramètres et classification dynamique dans le cadre de la
détection et du suivi de défaut de roulements." Ph.D diss, University of Reims Champagne-Ardenne,
Reims, France, 2016.
[2] Dalila Benmahdi, Lanto Rasolofondraibe, Xavier Chiementin, Sébastien Murer, and Ahmed Felkaoui.
"RT-OPTICS: real-time classification based on OPTICS method to monitor bearings faults." Journal
of Intelligent Manufacturing 30, no. 5 (2019): 2157-2170.
[3] Harris, Tedric A. Rolling bearing analysis. John Wiley and sons, 2001.
[4] Simmons, Colin H., and Dennis E. Maguire. Manual of engineering drawing: Technical product
specification and documentation to British and International Standards. Butterworth Heinemann,
2012
[5] Gupta, P. K. "Dynamics of rolling-element bearings—Part II: Cylindrical roller bearing results."
(1979): 305-311.
[6] Gupta, P. K. “Dynamics of rolling-element bearings—Part I: Cylindrical roller bearing analysis,” 1979.
[7] Rahnejat, H., and R. Gohar. "Design of profiled taper roller bearings." TRIBOLOGY international 12,
no. 6 (1979): 269-275.
[8] Tarawneh, Constantine M., Luz Sotelo, Anthony A. Villarreal, Nancy de los Santos, Ryan L.
Lechtenberg, and Robert Jones. "Temperature profiles of railroad tapered roller bearings with
defective inner and outer rings." Joint Rail Conference. American Society of Mechanical Engineers
Digital Collection, 2016.
[9] Blair, S., and W. O. Winer. "Tribological characteristics of needle bearings." Tribological Design of
Machine Elements 224 (1989).
[10] Kumar, Sanjay, Deepam Goyal, Rajeev K. Dang, Sukhdeep S. Dhami, and B. S. Pabla. "Condition
based maintenance of bearings and gears for fault detection–A review." Materials Today:
Proceedings 5, no. 2 (2018): 6128-6137.
[11] Khonsari, Michael M., and E. Richard Booser. Applied tribology: bearing design and lubrication. John
Wiley & Sons, 2017.
[12] Harris, Tedric A., and Michael N. Kotzalas. Essential concepts of bearing technology. CRC press,
2006.
[13] ISO, “ISO 15243:2004(en): Rolling bearings — Damage and failures — Terms, characteristics and
causes.” International Organization for Standardization, 2014.
[14] Kharche, Prashant P., and Sharad V. Kshirsagar. "Review of fault detection in rolling element
bearing." International Journal of Innovative Research in Advanced Engineering 1, no. 5 (2014): 169-
174.
[15] Analyse des Défaillances des roulements, Dommages par Type,
https://www.nskeurope.fr/fr/services/troubleshooting/damage-by-type.html
[16] Rezaei, Aida. "Fault Detection and Diagnosis on the rolling element bearing." PhD diss. Ottawa
Ontario, Carleton University, 2007.

116
[17] Smith, Wade A., and Robert B. Randall. "Rolling element bearing diagnostics using the Case Western
Reserve University data: A benchmark study." Mechanical Systems and Signal Processing 64 (2015):
100-131.
[18] Marwala, Tshilidzi, and Christina Busisiwe Vilakazi. "Condition monitoring using computational
intelligence." In Handbook of computational intelligence in manufacturing and production
management, pp. 106-123. IGI Global, 2008.
[19] Lin, Tian Ran, Kun Yu, and Jiwen Tan. "Condition monitoring and fault diagnosis of roller element
bearing." INTECH (2017): 39-75.
[20] Zhou, Wei, Thomas G. Habetler, and Ronald G. Harley. "Bearing condition monitoring methods for
electric machines: A general review." IEEE international symposium on diagnostics for electric
machines, power electronics and drives, pp. 3-6. IEEE, 2007.
[21] Zhou, Zude, Shane Shengquan Xie, and Dejun Chen. Fundamentals of digital manufacturing science.
Springer Science & Business Media, 2011.
[22] Márquez, Fausto Pedro García, Andrew Mark Tobias, Jesús María Pinar Pérez, and Mayorkinos
Papaelias. "Condition monitoring of wind turbines: Techniques and methods." Renewable Energy
46 (2012): 169-178.
[23] Kim, Wontae, Jinju Seo, and Dongpyp Hong. "Infrared thermographic inspection of ball bearing;
condition monitoring for defects under dynamic loading stages." In 18th World Conference on
Nondestructive Testing. 2012.
[24] Kim, Eric Y., Andy CC Tan, Joseph Mathew, and Bo-Suk Yang. "Condition monitoring of low speed
bearings: A comparative study of the ultrasound technique versus vibration measurements."
Australian Journal of Mechanical Engineering 5, no. 2 (2008): 177-189.
[25] Lim, Gang-Min, Dong-Myung Bae, and Joo-Hyung Kim. "Fault diagnosis of rotating machine by
thermography method on support vector machine." Journal of Mechanical Science and Technology
28, no. 8 (2014): 2947-2952.
[26] LAKEHAL, Abdelaziz, and E. Hadjadj-aoul. "Une nouvelle stratégie de diagnostic en maintenance
préventive conditionnelle." In 4th International Conference on Computer Integrated Manufacturing
CIP, pp. 2-5. 2007.
[27] Kostek, Robert, and Bogdan Żółtowski. "Rolling bearing defect detection and diagnostics."
Vibroengineering Procedia 6 (2015): 139-144.
[28] Manickam, Louis Rex Arun. "Proposal for the fourth generation of maintenance and the future
trends & challenges in production." (2012).
[29] Tandon, N. "A comparison of some vibration parameters for the condition monitoring of rolling
element bearings." Measurement 12, no. 3 (1994): 285-289.
[30] Gupta, Pankaj, and M. K. Pradhan. "Fault detection analysis in rolling element bearing: A review."
Materials Today: Proceedings 4, no. 2 (2017): 2085-2094.
[31] Fu, Sheng, Kun Liu, Yonggang Xu, and Yi Liu. "Rolling bearing diagnosing method based on time
domain analysis and adaptive fuzzy-means clustering." Shock and Vibration 2016.
[32] Kulkarni, Sham, and Anand Bewoor. "Vibration based condition assessment of ball bearing with
distributed defects." Journal of Measurements in Engineering 4, no. 2 (2016): 87-94.
[33] Kankar, Pavan Kumar, Satish C. Sharma, and Suraj Prakash Harsha. "Rolling element bearing fault
diagnosis using wavelet transform." Neurocomputing 74, no. 10 (2011): 1638-1645.

117
[34] Tandon, Naresh, and Achintya Choudhury. "A review of vibration and acoustic measurement
methods for the detection of defects in rolling element bearings." Tribology international 32, no. 8
(1999): 469-480.
[35] Ren, Yong, Wei Li, Bo Zhang, Zhencai Zhu, and Fang Jiang. "Fault Diagnosis of Rolling Bearings Based
on Improved Kurtogram in Varying Speed Conditions." Applied Sciences 9, no. 6 (2019): 1157.
[36] Sassi, Sadok, Bechir Badri, and Marc Thomas. "TALAF and THIKAT as innovative time domain
indicators for tracking BALL bearings." In Proceedings of the 24nd Seminar on machinery vibration,
Canadian Machinery Vibration Association, éditeur M. Thomas, Montréal, Canada, pp. 404-419.
2006.
[37] Thomas, Marc. "Maintenance prédictive et vibration des machines". Université du Québec,
Fiabilité, École de technologie supérieure 2012.
[38] Smith, J. D. "Vibration monitoring of bearings at low speeds." Tribology International 15, no. 3
(1982): 139-144.
[39] Kim, Eric Y., Andy CC Tan, Joseph Mathew, and Bo-Suk Yang. "Condition monitoring of low speed
bearings: A comparative study of the ultrasound technique versus vibration measurements."
Australian Journal of Mechanical Engineering 5, no. 2 (2008): 177-189.
[40] Garcia-Perez, Arturo, Juan Pablo Amezquita-Sanchez, Daniel Morinigo-Sotelo, and Konstantinos N.
Gyftakis. "Vibration Analysis as a Diagnosis Tool for Health Monitoring of Industrial Machines."
(2016).
[41] Muralidharan, Akhil, V. Sugumaran, K. P. Soman, and M. Amarnath. "Fault diagnosis of helical gear
box using variational mode decomposition and random forest algorithm." Structural Durability &
Health Monitoring 10, no. 1 (2014): 55.
[42] Shanmukha, Priya, M. R. Ramesh, and VPS. Naidu, "Bearing Health Condition Monitoring:
Frequency Domain Analysis Multi-sensor Data Fusion." International Journal of Advanced Research
in Electrical, Electronics and Instrumentation Engineering (An ISO Certified Organization), vol. 3, no.
5, pp. 260–268, 2014.
[43] Gao Huizhong, Lin Liang, Xiaoguang Chen, and Guanghua Xu. "Feature extraction and recognition
for rolling element bearing fault utilizing short-time Fourier transform and non-negative matrix
factorization." Chinese Journal of Mechanical Engineering 28, no. 1 (2015): 96-105.
[44] Reuben, Lim Chi Keong, and David Mba. "Bearing time-to-failure estimation using spectral analysis
features." Structural health monitoring 13, no. 2 (2014): 219-230.
[45] Lei, Yaguo, Zhengjia He, Yanyang Zi, and Xuefeng Chen. "New clustering algorithm-based fault
diagnosis using compensation distance evaluation technique." Mechanical Systems and Signal
Processing 22, no. 2 (2008): 419-435.
[46] Nguyen, Hung Ngoc, Jaeyoung Kim, and Jong-Myon Kim. "Optimal sub-band analysis based on the
envelope power Spectrum for effective fault detection in bearing under variable, low speeds."
Sensors 18, no. 5 (2018): 1389.
[47] Drouiche, K., M. Sidahmed, and Y. Grenier. "Détection de défauts d'engrenages par analyse
vibratoire." Traitement du signal 8, no. 5 (1992): 331.
[48] Djebili, Omar. "Contribution à la maintenance prédictive par analyse vibratoire des composants
mécaniques tournants. Application aux butées à billes soumises à la fatigue de contact de
roulement." Ph.D diss, University of Reims Champagne-Ardenne, Reims, France,2013.

118
[49] Trajin, Baptiste. "Analyse et traitement de grandeurs électriques pour la détection et le diagnostic
de défauts mécaniques dans les entrainements asynchrones. Application à la surveillance des
roulements à billes." PhD diss., Institut National Polytechnique de Toulouse-INPT, 2009.
[50] Ming, Yang, Jin Chen, and Guangming Dong. "Weak fault feature extraction of rolling bearing based
on cyclic Wiener filter and envelope spectrum." Mechanical Systems and Signal Processing 25, no.
5 (2011): 1773-1785.
[51] M.Thomas, A.Tahan, M. Kedadouche, “surveillance des roulements par emission acoustique : etude
comparative avec les techniques vibratoires pour une detection precoce” Séminaire ACVM en
Analyse des Vibrations, Fiabilité et Maintenance, pp. 1–17, 2012.
[52] Randall, R. B., and Wade Smith. "New cepstral methods for the diagnosis of gear and bearing faults
under variable speed conditions." In ICSV23 conference, Athens. 2016.
[53] Rogers, L. M. "The application of vibration signature analysis and acoustic emission source location
to on-line condition monitoring of anti-friction bearings." Tribology international 12, no. 2 (1979):
51-58.
[54] Sun, Kewen, Tian Jin, and Dongkai Yang. "An improved time-frequency analysis method in
interference detection for GNSS receivers." Sensors 15, no. 4 (2015): 9404-9426
[55] Aviyente, Selin, and William J. Williams. "Minimum entropy time-frequency distributions." IEEE
Signal Processing Letters 12, no. 1 (2004): 37-40.
[56] Pachori, Ram Bilas, and Pradip Sircar. "Time-frequency analysis using time-order representation
and Wigner distribution." In TENCON 2008-2008 IEEE Region 10 Conference, pp. 1-6. IEEE, 2008.
[57] Brodu, Nicolas, Fabien Lotte, and Anatole Lécuyer. "Comparative study of band-power extraction
techniques for motor imagery classification." In 2011 IEEE Symposium on Computational
Intelligence, Cognitive Algorithms, Mind, and Brain (CCMB), pp. 1-6. IEEE, 2011.
[58] Corino, Valentina DA, Luca T. Mainardi, Martin Stridh, and Leif Sornmo. "Improved time--frequency
analysis of atrial fibrillation signals using spectral modeling." IEEE Transactions on Biomedical
Engineering 55, no. 12 (2008): 2723-2730.
[59] Anderson, Eric J. "Limitations of short-time Fourier transforms in polyphonic pitch recognition."
Dept. Comp. Sci. Eng., Univ. Washington (1997).
[60] Elizondo, Martha Angélica, René E. Chávez, María Encarnación Cámara, and Andrés Tejero.
"Application of the Wigner-Ville distribution to interpret ground-penetrating radar anomalies."
Geofísica internacional 51, no. 2 (2012): 121-127.
[61] Zhang, Yufeng, Zhenyu Guo, Weilian Wang, Side He, Ting Lee, and Murray Loew. "A comparison of
the wavelet and short-time Fourier transforms for Doppler spectral analysis." Medical engineering
& physics 25, no. 7 (2003): 547-557.
[62] Shiroishi, J., S. Liang Y Li, S. Danyluk, and T. Kurfess. "Vibration analysis for bearing outer race
condition diagnostics." Journal of the Brazilian Society of Mechanical Sciences 21, no. 3 (1999): 484-
492.
[63] Gao, Zheyu, Jing Lin, Xiufeng Wang, and Xiaoqiang Xu. "Bearing fault detection based on empirical
wavelet transform and correlated kurtosis by acoustic emission." Materials 10, no. 6 (2017): 571.
[64] Saxena, Madhavendra, Olvin Oliver Bannet, Manoj Gupta, and R. P. Rajoria. "Bearing fault
monitoring using CWT based vibration signature." Procedia Engineering 144 (2016): 234-241.

119
[65] Tyagi, Sunil, and S. K. Panigrahi. "A simple continuous wavelet transform method for detection of
rolling element bearing faults and its comparison with envelope detection." Int. J. Sci. Res 6 (2017):
1033-1040.
[66] Junsheng, Cheng, Yu Dejie, and Yang Yu. "Time–energy density analysis based on wavelet
transform." Ndt & E International 38, no. 7 (2005): 569-572.
[67] SUN, Qiao, and Ying Tang. "Singularity analysis using continuous wavelet transform for bearing fault
diagnosis." Mechanical systems and signal processing 16, no. 6 (2002): 1025-1041.
[68] Prabhakar, S., A. R. Mohanty, and A. S. Sekhar. "Application of discrete wavelet transform for
detection of ball bearing race faults." Tribology International 35, no. 12 (2002): 793-800.
[69] Mori, K., N. Kasashima, T. Yoshioka, and Y. Ueno. "Prediction of spalling on a ball bearing by applying
the discrete wavelet transform to vibration signals." Wear 195, no. 1-2 (1996): 162-168.
[70] Yan, Ruqiang, Robert X. Gao, and Xuefeng Chen. "Wavelets for fault diagnosis of rotary machines:
A review with applications." Signal processing 96 (2014): 1-15.
[71] Kerroumi, Sanaa, Xavier Chiementin, and Lanto Rasolofondraibe. "Online classification for spalling
detection and vibratory behavior monitoring." Mechanics & Industry 15, no. 6 (2014): 517-524.
[72] McCormick, A. C., and A. K. Nandi. "Cyclostationarity in rotating machine vibrations." Mechanical
systems and signal processing 12, no. 2 (1998): 225-242.
[73] Antoni, Jérôme. "Cyclic spectral analysis of rolling-element bearing signals: Facts and fictions."
Journal of Sound and vibration 304, no. 3-5 (2007): 497-529.
[74] Feng, Zhipeng, and Fulei Chu. "Cyclostationary analysis for gearbox and bearing fault diagnosis."
Shock and Vibration 2015 (2015).
[75] Antoniadis, I., and G. Glossiotis. "Cyclostationary analysis of rolling-element bearing vibration
signals." Journal of sound and vibration 248, no. 5 (2001): 829-845.
[76] Dalpiaz, Giorgio, A. Rivola, and Riccardo Rubini. "Gear fault monitoring: comparison of vibration
analysis techniques." In 3rd International Conference Acoustical and Vibratory Surveillance
Methods and Diagnostics Techniques, pp. 623-632. 1998.
[77] Capdessus, C., M. Sidahmed, and J. L. Lacoume. "Cyclostationary processes: application in gear
faults early diagnosis." Mechanical systems and signal processing 14, no. 3 (2000): 371-385.
[78] Zhu, Z. K., Z. H. Feng, and F. R. Kong. "Cyclostationarity analysis for gearbox condition monitoring:
approaches and effectiveness." Mechanical Systems and Signal Processing 19, no. 3 (2005): 467-
482.
[79] Antoni, Jérôme, Frédéric Bonnardot, A. Raad, and Mohamed El Badaoui. "Cyclostationary modelling
of rotating machine vibration signals." Mechanical systems and signal processing 18, no. 6 (2004):
1285-1314.
[80] Mandic, Danilo P., Naveed ur Rehman, Zhaohua Wu, and Norden E. Huang. "Empirical mode
decomposition-based time-frequency analysis of multivariate signals: The power of adaptive data
analysis." IEEE signal processing magazine 30, no. 6 (2013): 74-86.
[81] Huang, Norden E., Zheng Shen, Steven R. Long, Manli C. Wu, Hsing H. Shih, Quanan Zheng, Nai-
Chyuan Yen, Chi Chao Tung, and Henry H. Liu. "The empirical mode decomposition and the Hilbert
spectrum for nonlinear and non-stationary time series analysis." Proceedings of the Royal Society
of London. Series A: mathematical, physical and engineering sciences 454, no. 1971 (1998): 903-
995.

120
[82] Lei, Yaguo, Jing Lin, Zhengjia He, and Ming J. Zuo. "A review on empirical mode decomposition in
fault diagnosis of rotating machinery." Mechanical systems and signal processing 35, no. 1-2 (2013):
108-126.
[83] Junsheng, Cheng, Zhang Kang, Yang Yu, and Y. U. De-jie. "Comparison between the methods of local
mean decomposition and empirical mode decomposition." Journal of Vibration and Shock 28, no.
5 (2009): 13-16.
[84] Lei, Yaguo, Jing Lin, Zhengjia He, and Ming J. Zuo. "A review on empirical mode decomposition in
fault diagnosis of rotating machinery." Mechanical systems and signal processing 35, no. 1-2 (2013):
108-126.
[85] Bin, G. F., J. J. Gao, X. J. Li, and B. S. Dhillon. "Early fault diagnosis of rotating machinery based on
wavelet packets—Empirical mode decomposition feature extraction and neural network."
Mechanical Systems and Signal Processing 27 (2012): 696-711.
[86] Sun, Qiao, Ping Chen, Dajun Zhang, and Fengfeng Xi. "Pattern recognition for automatic machinery
fault diagnosis." J. Vib. Acoust. 126, no. 2 (2004): 307-316.
[87] Kaur, Rajleen. "An Overview of Pattern Recognition Applications and Its Approaches: A Review."
International Journal of Science and Research (IJSR), ISSN (2014): 2319-7064.
[88] Pavlidis, Theodosios. "Advanced Segmentation Techniques." In Structural pattern recognition, pp.
90-123. Springer, Berlin, Heidelberg, 1977.
[89] Liu, Jie, Jigui Sun, and Shengsheng Wang. "Pattern recognition: An overview." IJCSNS International
Journal of Computer Science and Network Security 6, no. 6 (2006): 57-61.
[90] Jain, Anil K., Robert P. W. Duin, and Jianchang Mao. "Statistical pattern recognition: A review." IEEE
Transactions on pattern analysis and machine intelligence 22, no. 1 (2000): 4-37.
[91] Dubois, Didier, Laurent Foulloy, Gilles Mauris, and Henri Prade. "Probability-possibility
transformations, triangular fuzzy sets, and probabilistic inequalities." Reliable computing 10, no. 4
(2004): 273-297.
[92] Bezdek, James C. Pattern recognition with fuzzy objective function algorithms. Springer Science &
Business Media, 2013.
[93] Duda, Richard O., and Peter E. Hart. Pattern classification and scene analysis. Vol. 3. New York:
Wiley, 1973.
[94] Venguerov, Mark, and Pádraig Cunningham. "Generalised syntactic pattern recognition as a
unifying approach in image analysis." In Joint IAPR International Workshops on Statistical
Techniques in Pattern Recognition (SPR) and Structural and Syntactic Pattern Recognition (SSPR),
pp. 913-920. Springer, Berlin, Heidelberg, 1998.
[95] Manacher, Glenn K. "An improved version of the Cocke-Younger-Kasami algorithm." Computer
Languages 3, no. 2 (1978): 127-133.
[96] Niitsuma, Hiroaki, and Tsutomu Maruyama. "Sum of absolute difference implementations for
image processing on FPGAs." In 2010 International Conference on Field Programmable Logic and
Applications, pp. 167-170. IEEE, 2010.
[97] Brunelli, Roberto."Template matching techniques in computer vision: theory and practice."John
Wiley & Sons, 2009.
[98] Aksoy, M. S., Orhan Torkul, and Ismail Hakki Cedimoglu. "An industrial visual inspection system that
uses inductive learning." Journal of Intelligent Manufacturing 15, no. 4 (2004): 569-574.

121
[99] Kyriacou, Theocharis, Guido Bugmann, and Stanislao Lauria. "Vision-based urban navigation
procedures for verbally instructed robots." Robotics and Autonomous Systems 51, no. 1 (2005): 69-
80.
[100] Davies, G., and S. Bowsher. "Algorithms for pattern matching." Software: Practice and Experience
16, no. 6 (1986): 575-601.
[101] Yoo, Jae-Chern, and Tae Hee Han. "Fast normalized cross-correlation." Circuits, systems and signal
processing 28, no. 6 (2009): 819.
[102] Vassiliadis, Stamatis, Edwin A. Hakkennes, J. S. S. M. Wong, and Gerald G. Pechanek. "The sum-
absolute-difference motion estimation accelerator." In Proceedings. 24th EUROMICRO Conference
(Cat. No. 98EX204), vol. 2, pp. 559-566. IEEE, 1998.
[103] Yousif, Jabar H., and Mabruk A. Fekihal. "Neural approach for determining mental health
problems." Journal of Computing 4, no. 1 (2012): 6-11.
[104] Davalo, Eric, Patrick Naïm, and F. M. Clément. Des réseaux de neurones. Paris: Eyrolles, 1989.
[105] Impedovo, Sebastiano, Lorenzo Ottaviano, and Silvia Occhinegro. "Optical character recognition—
a survey." International journal of pattern recognition and artificial intelligence 5, no. 01n02 (1991):
1-24.
[106] Lanitis, Andreas, Christopher J. Taylor, and Timothy F. Cootes. "Automatic interpretation and coding
of face images using flexible models." IEEE Transactions on Pattern Analysis and machine
intelligence 19, no. 7 (1997): 743-756.
[107] Mazeghrane, Sofiane, Laurent Hartert, and Moamar Sayed-Mouchaweh. "Dynamic pattern
recognition for the diagnosis of evolving systems." In 2011 IEEE Workshop on Evolving and Adaptive
Intelligent Systems (EAIS), pp. 124-130. IEEE, 2011.
[108] Hartert, Laurent. "Reconnaissance des formes dans un environnement dynamique appliquée au
diagnostic et au suivi des systèmes évolutifs." Ph.D diss, University of Reims Champagne-Ardenne,
Reims, France, 2010.
[109] Haken, Hermann, ed. Pattern Formation by Dynamic Systems and Pattern Recognition: Proceedings
of the International Symposium on Synergetics at Schloß Elmau, Bavaria, April 30–May 5, 1979. Vol.
5. Springer Science & Business Media, 2012.
[110] Teh, Hui Yie, Andreas W. Kempa-Liehr, I. Kevin, and Kai Wang. "Sensor data quality: a systematic
review." Journal of Big Data 7, no. 1 (2020): 11.
[111] Asch, Georges, and Bernard Poussery."Les capteurs en instrumentation industrielle-8e éd." Dunod,
2017.
[112] Collet FR."Traitement des signaux et acquisiton des données." Dunod; 1997.
[113] Hoult, David I., and R. E. Richards. "The signal-to-noise ratio of the nuclear magnetic resonance
experiment." Journal of Magnetic Resonance (1969) 24, no. 1 (1976): 71-85.
[114] Deshpande, Amol, Carlos Guestrin, Samuel R. Madden, Joseph M. Hellerstein, and Wei Hong.
"Model-driven data acquisition in sensor networks." In Proceedings of the Thirtieth international
conference on Very large data bases-Volume 30, pp. 588-599. 2004.
[115] Mailly, Frédérick, Alain Giani, A. Martinez, R. Bonnot, Pierre Temple-Boyer, and Alexandre Boyer.
"Micromachined thermal accelerometer." Sensors and Actuators A: Physical 103, no. 3 (2003): 359-
363.

122
[116] De Reus, Roger, Jens Ole Gulløv, and Patrick R. Scheeper. "Fabrication and characterization of a
piezoelectric accelerometer." Journal of Micromechanics and Microengineering 9, no. 2 (1999):
123.
[117] Wang, Yu-Hsuan, Pengfei Song, Xiao Li, Changhai Ru, Giovanni Ferrari, Prabakaran
Balasubramanian, Marco Amabili, Yu Sun, and Xinyu Liu. "A paper-based piezoelectric
accelerometer." Micromachines 9, no. 1 (2018): 19.
[118] Wu, T. Y., C. H. Lai, and D. C. Liu. "Defect diagnostics of roller bearing using instantaneous frequency
normalization under fluctuant rotating speed." Journal of Mechanical Science and Technology 30,
no. 3 (2016): 1037-1048.
[119] Hotait, Hassane, Xavier Chiementin, and Lanto Rasolofondraibe. "AOC-OPTICS: Automatic Online
Classification for Condition Monitoring of Rolling Bearing." Processes 8, no. 5 (2020): 606.
[120] Jian, Xianzhong, Wenlong Li, Xuguang Guo, and Ruzhi Wang. "Fault diagnosis of motor bearings
based on a one-dimensional fusion neural network." Sensors 19, no. 1 (2019): 122.
[121] Liu, Lei, Dongli Song, Zilin Geng, and Zejun Zheng. "A Real-Time Fault Early Warning Method for a
High-Speed EMU Axle Box Bearing." Sensors 20, no. 3 (2020): 823.
[122] Chouaib, Hassan. "Sélection de caractéristiques: méthodes et applications." Paris Descartes
University: Paris, France (2011).
[123] Vakharia, V., V. K. Gupta, and P. K. Kankar. "Efficient fault diagnosis of ball bearing using ReliefF and
Random Forest classifier." Journal of the Brazilian Society of Mechanical Sciences and Engineering
39, no. 8 (2017): 2969-2982.
[124] Sharma, Aditya, M. Amarnath, and Pavan Kumar Kankar. "Novel ensemble techniques for
classification of rolling element bearing faults." Journal of the Brazilian Society of Mechanical
Sciences and Engineering 39, no. 3 (2017): 709-724.
[125] Lu, Chen, Zhenya Wang, and Bo Zhou. "Intelligent fault diagnosis of rolling bearing using hierarchical
convolutional network based health state classification." Advanced Engineering Informatics 32
(2017): 139-151.
[126] Tang, Tao, Lin Bo, Xiaofeng Liu, Bing Sun, and Daiping Wei. "Variable predictive model class
discrimination using novel predictive models and adaptive feature selection for bearing fault
identification." Journal of Sound and Vibration 425 (2018): 137-148.
[127] Sharma, Abhishek, V. Sugumaran, and S. Babu Devasenapati. "Misfire detection in an IC engine
using vibration signal and decision tree algorithms." Measurement 50 (2014): 370-380.
[128] Hernández-Muriel, José Alberto, John Bryan Bermeo-Ulloa, Mauricio Holguin-Londoño, Andrés
Marino Álvarez-Meza, and Álvaro Angel Orozco-Gutiérrez. "Bearing Health Monitoring Using Relief-
F-Based Feature Relevance Analysis and HMM." Applied Sciences 10, no. 15 (2020): 5170.
[129] Parlar, Tuba, and Esra Sarac. "IWD Based Feature Selection Algorithm for Sentiment Analysis."
Elektronika ir Elektrotechnika 25, no. 1 (2019): 54-58.
[130] Girondin, Victor, Komi Midzodzi Pekpe, Herve Morel, and Jean-Philippe Cassar. "Bearings fault
detection in helicopters using frequency readjustment and cyclostationary analysis." Mechanical
Systems and Signal Processing 38, no. 2 (2013): 499-514.
[131] Xie, Yuan, and Tao Zhang. "A fault diagnosis approach using SVM with data dimension reduction by
PCA and LDA method." In 2015 Chinese Automation Congress (CAC), pp. 869-874. IEEE, 2015.

123
[132] Liu, Hongmei, Xuan Wang, and Chen Lu. "Rolling bearing fault diagnosis under variable conditions
using Hilbert-Huang transform and singular value decomposition." Mathematical Problems in
Engineering 2014 (2014).
[133] Yu, Jian-Bo. "Bearing performance degradation assessment using locality preserving projections."
Expert Systems with Applications 38, no. 6 (2011): 7440-7450.
[134] Gao, Yun-guang, Shunbo Liu, and Zhen-ren ZHANG. "Fault detection and diagnosis for sensor in
HVAC system based on KPCA." Transducer and Microsystem Technologies 27, no. 5 (2008): 37-39.
[135] Zheng, Jinde, Zhanwei Jiang, and Haiyang Pan. "Sigmoid-based refined composite multiscale fuzzy
entropy and t-SNE based fault diagnosis approach for rolling bearing." Measurement 129 (2018):
332-342.
[136] Zhong, Xiao-Feng, De-Qiang He, and Jian Miao. "Fault diagnosis of locomotive running gear rolling
bearing based on PCA-LSSVM." Journal of Guangxi University (Natural Science Edition) 2 (2014):
016.
[137] Jolliffe, Ian T., and Jorge Cadima. "Principal component analysis: a review and recent
developments." Philosophical Transactions of the Royal Society A: Mathematical, Physical and
Engineering Sciences 374, no. 2065 (2016): 20150202.
[138] Bryant, Fred B., and Paul R. Yarnold. "Principal-components analysis and exploratory and
confirmatory factor analysis." (1995).
[139] Yin, Aijun, Juncheng Lu, Zongxian Dai, Jiang Li, and Qi Ouyang. "Isomap and Deep Belief Network-
Based Machine Health Combined Assessment Model." Strojniski Vestnik/Journal of Mechanical
Engineering 62, no. 12 (2016).
[140] Wang, Xiang, Yuan Zheng, Zhenzhou Zhao, and Jinping Wang. "Bearing fault diagnosis based on
statistical locally linear embedding." Sensors 15, no. 7 (2015): 16225-16247.
[141] Van Der Maaten, Laurens. "Accelerating t-SNE using tree-based algorithms." The Journal of
Machine Learning Research 15, no. 1 (2014): 3221-3245.
[142] Cao, L. J., Kok Seng Chua, W. K. Chong, H. P. Lee, and Q. M. Gu. "A comparison of PCA, KPCA and
ICA for dimensionality reduction in support vector machine." Neurocomputing 55, no. 1-2 (2003):
321-336.
[143] Sakthivel, N. R., Binoy B. Nair, M. Elangovan, V. Sugumaran, and S. Saravanmurugan. "Comparison
of dimensionality reduction techniques for the fault diagnosis of mono block centrifugal pump using
vibration signals." Engineering Science and Technology, an International Journal 17, no. 1 (2014):
30-38.
[144] Ni, Jianjun, Chuanbiao Zhang, and Simon X. Yang. "An adaptive approach based on KPCA and SVM
for real-time fault diagnosis of HVCBs." IEEE Transactions on Power Delivery 26, no. 3 (2011): 1960-
1971.
[145] Honeine, Paul. "Online kernel principal component analysis: A reduced-order model." IEEE
transactions on pattern analysis and machine intelligence 34, no. 9 (2011): 1814-1826.
[146] Maaten, Laurens van der, and Geoffrey Hinton. "Visualizing data using t-SNE." Journal of machine
learning research 9, no. Nov (2008): 2579-2605.
[147] Maaten, Laurens van der, and Geoffrey Hinton. "Visualizing data using t-SNE." Journal of machine
learning research 9, no. Nov (2008): 2579-2605.

124
[148] Kotsiantis, Sotiris B., I. Zaharakis, and P. Pintelas. "Supervised machine learning: A review of
classification techniques." Emerging artificial intelligence applications in computer engineering 160,
no. 1 (2007): 3-24.
[149] Loog, Marco. "Supervised classification: Quite a brief overview." In Machine Learning Techniques
for Space Weather, pp. 113-145. Elsevier, 2018.
[150] Yan, Xiaoan, and Minping Jia. "A novel optimized SVM classification algorithm with multi-domain
feature and its application to fault diagnosis of rolling bearing." Neurocomputing 313 (2018): 47-
64.
[151] L. Samaniego, A. Bárdossy, and K. Schulz, “Supervised classification of remotely sensed imagery
using a modified k-NN technique,” IEEE Transactions on Geoscience and Remote Sensing, vol. 46,
no. 7, pp. 2112–2125, Jul. 2008.
[152] Zhang, Nannan, Lifeng Wu, Jing Yang, and Yong Guan. "Naive bayes bearing fault diagnosis based
on enhanced independence of data." Sensors 18, no. 2 (2018): 463.
[153] Filippi, Anthony M., and John R. Jensen. "Fuzzy learning vector quantization for hyperspectral
coastal vegetation classification." Remote Sensing of Environment 100, no. 4 (2006): 512-530.
[154] Liu, Zhiwen, Hongrui Cao, Xuefeng Chen, Zhengjia He, and Zhongjie Shen. "Multi-fault classification
based on wavelet SVM with PSO algorithm to analyze vibration signals from rolling element
bearings." Neurocomputing 99 (2013): 399-410.
[155] Saimurugan, M., K. I. Ramachandran, V. Sugumaran, and N. R. Sakthivel. "Multi component fault
diagnosis of rotational mechanical system based on decision tree and support vector machine."
Expert Systems with Applications 38, no. 4 (2011): 3819-3826.
[156] Wang, Haiya, Zhongqing Yu, and Lu Guo. "Real-time Online Fault Diagnosis of Rolling Bearings Based
on KNN Algorithm." In Journal of Physics: Conference Series, vol. 1486, p. 03. 2020.
[157] B. Tay, J. K. Hyun, and S. Oh, “A machine learning approach for specification of spinal cord injuries
using fractional anisotropy values obtained from diffusion tensor images,” Computational and
Mathematical Methods in Medicine, vol. 2014, no.20 March 2014.
[158] Pandya, D. H., S. H. Upadhyay, and Suraj Prakash Harsha. "Fault diagnosis of rolling element bearing
with intrinsic mode function of acoustic emission data using APF-KNN." Expert Systems with
Applications 40, no. 10 (2013): 4137-4145.
[159] Gan, Xiong, Hong Lu, Guangyou Yang, and Jing Liu. "Rolling bearing diagnosis based on composite
multiscale weighted permutation entropy." Entropy 20, no. 11 (2018): 821.
[160] Si, Xiao-Sheng, Chang-Hua Hu, Enrico Zio, and Gang Li. "Modeling for prognostics and health
management: methods and applications." (2015).
[161] Jayaswal, Pratesh, S. N. Verma, and A. K. Wadhwani. "Application of ANN, fuzzy logic and wavelet
transform in machine fault diagnosis using vibration signal analysis." Journal of Quality in
Maintenance Engineering (2010).
[162] Berger, James O., Elías Moreno, Luis Raul Pericchi, M. Jesús Bayarri, José M. Bernardo, Juan A. Cano,
Julián De la Horra et al. "An overview of robust Bayesian analysis." Test 3, no. 1 (1994): 5-124.
[163] Tsoumakas, Grigorios, and Ioannis Katakis. "Multi-label classification: An overview." International
Journal of Data Warehousing and Mining (IJDWM) 3, no. 3 (2007): 1-13.
[164] Zhang, Nannan, Lifeng Wu, Jing Yang, and Yong Guan. "Naive bayes bearing fault diagnosis based
on enhanced independence of data." Sensors 18, no. 2 (2018): 463.

125
[165] Joshuva, A., and V. Sugumaran. "A comparative study of Bayes classifiers for blade fault diagnosis
in wind turbines through vibration signals." Structural Durability & Health Monitoring 11, no. 1
(2017): 69.
[166] Saputra, Muhammad Firman Aji, Triyanna Widiyaningtyas, and Aji Prasetya Wibawa. "Illiteracy
Classification Using K Means-Naïve Bayes Algorithm." JOIV: International Journal on Informatics
Visualization 2, no. 3 (2018): 153-158.
[167] Hassoun, Mohamad H. Fundamentals of artificial neural networks. MIT press, 1995.
[168] Pandya, D. H., S. H. Upadhyay, and S. P. Harsha. "ANN based fault diagnosis of rolling element
bearing using time-frequency domain feature." International Journal of Engineering Science and
Technology 4, no. 6 (2012): 2878-2886.
[169] “Réseau de neurones artificiels Wikipédia.”
https://fr.wikipedia.org/wiki/Réseau_de_neurones_artificiels.
[170] Li, Bo, M-Y. Chow, Yodyium Tipsuwan, and James C. Hung. "Neural-network-based motor rolling
bearing fault diagnosis." IEEE transactions on industrial electronics 47, no. 5 (2000): 1060-1069.
[171] Montavon, Grégoire, Wojciech Samek, and Klaus-Robert Müller. "Methods for interpreting and
understanding deep neural networks." Digital Signal Processing 73 (2018): 1-15.
[172] Paya, B. A., I. I. Esat, and M. N. M. Badi. "Artificial neural network based fault diagnostics of rotating
machinery using wavelet transforms as a preprocessor." Mechanical systems and signal processing
11, no. 5 (1997): 751-765.
[173] Gunerkar, Rohit S., Arun Kumar Jalan, and Sachin U. Belgamwar. "Fault diagnosis of rolling element
bearing based on artificial neural network." Journal of Mechanical Science and Technology 33, no.
2 (2019): 505-511.
[174] Nalepa, Jakub, and Michal Kawulok. "Selecting training sets for support vector machines: a review."
Artificial Intelligence Review 52, no. 2 (2019): 857-900.
[175] Mowlaei, Amir, and Karim Faez. "Recognition of isolated handwritten Persian/Arabic characters and
numerals using support vector machines." In 2003 IEEE XIII Workshop on Neural Networks for Signal
Processing (IEEE Cat. No. 03TH8718), pp. 547-554. IEEE, 2003.
[176] Way, Ted W., Berkman Sahiner, Lubomir M. Hadjiiski, and Heang‐Ping Chan. "Effect of finite sample
size on feature selection and classification: a simulation study." Medical physics 37, no. 2 (2010):
907-920.
[177] Bag, Amalendu, Manmohan Sahoo, and Aswini Kumar Mohanty. "An assessment of Diagnosis and
Prognosis of Breast Cancer Using Image Mining."
[178] Ben-Hur, Asa, and Jason Weston. "A user’s guide to support vector machines." In Data mining
techniques for the life sciences, pp. 223-239. Humana Press, 2010.
[179] Larhmam, “File:SVM margin.png - Wikipedia.” https://en.wikipedia.org/wiki/File:SVM_margin.png.
[180] Wang, Lijun, Shengfei Ji, and Nanyang Ji. "Comparison of Support Vector Machine-Based
Techniques for Detection of Bearing Faults." Shock and Vibration 2018 (2018).
[181] Chattopadhyay, P., and P. Konar. "Feature extraction using wavelet transform for multi-class fault
detection of induction motor." Journal of The Institution of Engineers (India): Series B 95, no. 1
(2014): 73-81.

126
[182] Tyagi, Sunil, and Sashi Kanta Panigrahi. "An improved envelope detection method using particle
swarm optimisation for rolling element bearing fault diagnosis." Journal of Computational Design
and Engineering 4, no. 4 (2017): 305-317.
[183] Hayes, Timothy, Satoshi Usami, Ross Jacobucci, and John J. McArdle. "Using Classification and
Regression Trees (CART) and random forests to analyze attrition: Results from two simulations."
Psychology and aging 30, no. 4 (2015): 911.
[184] M. Amarnath, V. Sugumaran, and H. Kumar, “Exploiting sound signals for fault diagnosis of bearings
using decision tree,” Measurement: Journal of the International Measurement Confederation, vol.
46, no. 3, pp. 1250–1256, 2013.
[185] Guillaume, Serge, and Brigitte Charnomordic. "Learning interpretable fuzzy inference systems with
FisPro." Information Sciences 181, no. 20 (2011): 4409-4427.
[186] Amarnath, M., V. Sugumaran, and Hemantha Kumar. "Exploiting sound signals for fault diagnosis of
bearings using decision tree." Measurement 46, no. 3 (2013): 1250-1256.
[187] Qin, Xiwen, Qiaoling Li, Xiaogang Dong, and Siqi Lv. "The fault diagnosis of rolling bearing based on
ensemble empirical mode decomposition and random forest." Shock and Vibration 2017 (2017).
[188] Aharamuthu, Krishnakumari, and Elayaperumal Ayyasamy. "Gear fault diagnosis using vibration
signals based on decision tree assisted intelligent controllers." Journal of Vibroengineering 15, no.
4 (2013): 1826-1837.
[189] Saravanan, N., S. Cholairajan, and K. I. Ramachandran. "Vibration-based fault diagnosis of spur bevel
gear box using fuzzy technique." Expert systems with applications 36, no. 2 (2009): 3119-3135.
[190] Olaode, Abass, Golshah Naghdy, and Catherine Todd. "Unsupervised classification of images: A
review." International Journal of Image Processing 8, no. 5 (2014): 325-342.
[191] Silla, Carlos N., and Alex A. Freitas. "A survey of hierarchical classification across different
application domains." Data Mining and Knowledge Discovery 22, no. 1-2 (2011): 31-72.
[192] Grochtmann, Matthias, and Klaus Grimm. "Classification trees for partition testing." Software
Testing, Verification and Reliability 3, no. 2 (1993): 63-82.
[193] van Kemenade, Cees HM, Han La Poutre, and Robert J. Mokken. "Density-based unsupervised
classification for remote sensing." In Machine vision and advanced image processing in remote
sensing, pp. 248-258. Springer, Berlin, Heidelberg, 1999.
[194] Guha, Sudipto, Rajeev Rastogi, and Kyuseok Shim. "CURE: an efficient clustering algorithm for large
databases." ACM Sigmod record 27, no. 2 (1998): 73-84.
[195] Karypis, George, Eui-Hong Han, and Vipin Kumar. "Chameleon: Hierarchical clustering using
dynamic modeling." Computer 32, no. 8 (1999): 68-75.
[196] Van der Laan, Mark, Katherine Pollard, and Jennifer Bryan. "A new partitioning around medoids
algorithm." Journal of Statistical Computation and Simulation 73, no. 8 (2003): 575-584.
[197] Zhang, Qiaoping, and Isabelle Couloigner. "A new and efficient k-medoid algorithm for spatial
clustering." In International conference on computational science and its applications, pp. 181-189.
Springer, Berlin, Heidelberg, 2005.
[198] Ng, Raymond T., and Jiawei Han. "CLARANS: A method for clustering objects for spatial data
mining." IEEE transactions on knowledge and data engineering 14, no. 5 (2002): 1003-1016.

127
[199] Schubert, Erich, Jörg Sander, Martin Ester, Hans Peter Kriegel, and Xiaowei Xu. "DBSCAN revisited,
revisited: why and how you should (still) use DBSCAN." ACM Transactions on Database Systems
(TODS) 42, no. 3 (2017): 1-21.
[200] Hinneburg, Alexander, and Hans-Henning Gabriel. "Denclue 2.0: Fast clustering based on kernel
density estimation." In International symposium on intelligent data analysis, pp. 70-80. Springer,
Berlin, Heidelberg, 2007.
[201] Ankerst, Mihael, Markus M. Breunig, Hans-Peter Kriegel, and Jörg Sander. "OPTICS: ordering points
to identify the clustering structure." ACM Sigmod record 28, no. 2 (1999): 49-60.
[202] Taborri, Juri, Eduardo Palermo, Stefano Rossi, and Paolo Cappa. "Gait partitioning methods: A
systematic review." Sensors 16, no. 1 (2016): 66.
[203] Oyelade, O. J., Olufunke O. Oladipupo, and I. C. Obagbuwa. "Application of k Means Clustering
algorithm for prediction of Students Academic Performance." arXiv preprint arXiv:1002.2425
(2010).
[204] Yiakopoulos, Christos, Konstantinos Gryllias, and Ioannis Antoniadis. "Rolling element bearing fault
classification using K-means frequency domain based clustering." In International Design
Engineering Technical Conferences and Computers and Information in Engineering Conference, vol.
48982, pp. 127-134. 2009.
[205] Sharma, Alok, Yosvany López, and Tatsuhiko Tsunoda. "Divisive hierarchical maximum likelihood
clustering." BMC bioinformatics 18, no. 16 (2017): 546.
[206] La Classification Ascendante Hiérarchique (CAH), http://www.jybaudot.fr/Analdonnees/cah.html.
[207] Xhafa, Fatos, Santi Caballé, Ajith Abraham, Thanasis Daradoumis, and Angel A. Juan, eds.
Computational intelligence for technology enhanced learning. Vol. 273. Springer, 2010.
[208] Teleman, Johan, Hannes L. Röst, George Rosenberger, Uwe Schmitt, Lars Malmström, Johan
Malmström, and Fredrik Levander. "DIANA—algorithmic improvements for analysis of data-
independent acquisition MS data." Bioinformatics 31, no. 4 (2015): 555-562.
[209] Ajmera, Jitendra, and Chuck Wooters. "A robust speaker clustering algorithm." Workshop on
Automatic Speech Recognition and Understanding (IEEE Cat. No. 03EX721), pp. 411-416. IEEE, 2003.
[210] Campello, Ricardo JGB, Davoud Moulavi, and Jörg Sander. "Density-based clustering based on
hierarchical density estimates." In Pacific-Asia conference on knowledge discovery and data mining,
pp. 160-172. Springer, Berlin, Heidelberg, 2013.
[211] Ester, Martin, Hans-Peter Kriegel, Jörg Sander, and Xiaowei Xu. "A density-based algorithm for
discovering clusters in large spatial databases with noise." In Kdd, vol. 96, no. 34, pp. 226-231. 1996.
[212] Khan, Kamran, Saif Ur Rehman, Kamran Aziz, Simon Fong, and Sababady Sarasvady. "DBSCAN: Past,
present and future." In The fifth international conference on the applications of digital information
and web technologies (ICADIWT 2014), pp. 232-238. IEEE, 2014.
[213] Schubert, Erich, Jörg Sander, Martin Ester, Hans Peter Kriegel, and Xiaowei Xu. "DBSCAN revisited,
revisited: why and how you should (still) use DBSCAN." ACM Transactions on Database Systems
(TODS) 42, no. 3 (2017): 1-21.
[214] Wang, Wei-Tung, Yi-Leh Wu, Cheng-Yuan Tang, and Maw-Kae Hor. "Adaptive density-based spatial
clustering of applications with noise (DBSCAN) according to data." In 2015 International Conference
on Machine Learning and Cybernetics (ICMLC), vol. 1, pp. 445-451. IEEE, 2015.

128
[215] Gustafson, Donald E., and William C. Kessel. "Fuzzy clustering with a fuzzy covariance matrix." In
1978 IEEE conference on decision and control including the 17th symposium on adaptive processes,
pp. 761-766. IEEE, 1979.
[216] Xie, Xuanli Lisa, and Gerardo Beni. "A validity measure for fuzzy clustering." IEEE Transactions on
pattern analysis and machine intelligence 13, no. 8 (1991): 841-847.
[217] Bao, Hanqing, Dongping Ming, Ya Guo, Kui Zhang, Keqi Zhou, and Shigao Du. "DFCNN-Based
Semantic Recognition of Urban Functional Zones by Integrating Remote Sensing Data and POI
Data." Remote Sensing 12, no. 7 (2020): 1088.
[218] Yuan, Yufei, and Huijun Zhuang. "A genetic algorithm for generating fuzzy classification rules." Fuzzy
sets and systems 84, no. 1 (1996): 1-19.
[219] Bezdek, James C., Robert Ehrlich, and William Full. "FCM: The fuzzy c-means clustering algorithm."
Computers & Geosciences 10, no. 2-3 (1984): 191-203.
[220] Jain, Anil K., M. Narasimha Murty, and Patrick J. Flynn. "Data clustering: a review." ACM computing
surveys (CSUR) 31, no. 3 (1999): 264-323.
[221] Pandit, Shraddha, and Suchita Gupta. "A comparative study on distance measuring approaches for
clustering." International Journal of Research in Computer Science 2, no. 1 (2011): 29-31.
[222] Durak, Bahadir. "A Classification Algorithm Using Mahalanobis Distances Clustering of Data with
Applications on Biomedical Data Set." Master’s Thesis, Middle East Technical University, Ankara,
Turkey, (2011).
[223] Krishnan, Shaji, and Hans G. Kerkhoff. "Exploiting multiple mahalanobis distance metrics to screen
outliers from analog product manufacturing test responses." IEEE Design & Test 30, no. 3 (2013):
18-24.
[224] Egan, William J., and Stephen L. Morgan. "Outlier detection in multivariate analytical chemical
data." Analytical chemistry 70, no. 11 (1998): 2372-2379.
[225] Krishnan, Shaji, and Hans G. Kerkhoff. "Exploiting multiple mahalanobis distance metrics to screen
outliers from analog product manufacturing test responses." IEEE Design & Test 30, no. 3 (2013):
18-24.
[226] Soler, Julien, Fabien Tencé, Laurent Gaubert, and Cédric Buche. "Data clustering and similarity." In
The Twenty-Sixth International FLAIRS Conference. 2013.
[227] Xu, Rui, and Donald Wunsch. "Survey of clustering algorithms." IEEE Transactions on neural
networks 16, no. 3 (2005): 645-678.
[228] Potolea, Rodica, Silviu Cacoveanu, and Camelia Lemnaru. "Meta-learning framework for prediction
strategy evaluation." In International Conference on Enterprise Information Systems, pp. 280-295.
Springer, Berlin, Heidelberg, 2010.
[229] Bellet, Aurélien, Amaury Habrard, and Marc Sebban. "A survey on metric learning for feature
vectors and structured data." arXiv preprint arXiv: 1306.6709 (2013).
[230] Basu, Sugato, Arindam Banerjee, and Raymond Mooney. "Semi-supervised clustering by seeding."
In In Proceedings of 19th International Conference on Machine Learning (ICML-2002). 2002.
[231] Zhu, Xiaojin, and Andrew B. Goldberg. "Introduction to semi-supervised learning." Synthesis
lectures on artificial intelligence and machine learning 3, no. 1 (2009): 1-130.

129
[232] Chen, Xinan, Zhipeng Wang, Zhe Zhang, Limin Jia, and Yong Qin. "A semi-supervised approach to
bearing fault diagnosis under variable conditions towards imbalanced unlabeled data." Sensors 18,
no. 7 (2018): 2097.
[233] Tian, Jing, Michael H. Azarian, and Michael Pecht. "Rolling element bearing fault detection using
density-based clustering." In 2014 International Conference on Prognostics and Health
Management, pp. 1-7. IEEE, 2014.
[234] Kerroumi, Sanaa, Xavier Chiementin, and Lanto Rasolofondraibe. "Online classification for spalling
detection and vibratory behavior monitoring." Mechanics & Industry 15, no. 6 (2014): 517-524.
[235] Guo, Liang, Hongli Gao, Haifeng Huang, Xiang He, and ShiChao Li. "Multifeatures fusion and
nonlinear dimension reduction for intelligent bearing condition monitoring." Shock and Vibration
2016 (2016).
[236] DJOUADA, Mohamed, Ridha ZIANI, Ahmed FELKAOUI, and Rabah ZEGADI. "Diagnostic des défauts
par un Couplage réseaux de neurones artificiels-algorithmes génétiques." In 4th International
Conference on Computer Integrated Manufacturing CIP'2007. 2007.
[237] Strączkiewicz, Marcin, Piotr Czop, and Tomasz Barszcz. "Supervised and unsupervised learning
process in damage classification of rolling element bearings." Diagnostyka 17 (2016).
[238] Łukasik, Szymon, Piotr A. Kowalski, Małgorzata Charytanowicz, and Piotr Kulczycki. "Clustering using
flower pollination algorithm and Calinski-Harabasz index." In 2016 IEEE Congress on Evolutionary
Computation (CEC), pp. 2724-2728. IEEE, 2016.
[239] Petrovic, Slobodan. "A comparison between the silhouette index and the davies-bouldin index in
labelling ids clusters." In Proceedings of the 11th Nordic Workshop of Secure IT Systems, pp. 53-64.
sn, 2006.
[240] Chiementin, X. Localization and quantification of vibratory sources for a predictive maintenance in
order to increase the diagnosis and the follow-up of the damage of the rotating mechanical
components: Application to rolling bearings. Ph.D diss, University of Reims Champagne-Ardenne,
Reims, France, October 2007.
[241] Blodt, Martin, Pierre Granjon, Bertrand Raison, and Gilles Rostaing. "Models for bearing damage
detection in induction motors using stator current monitoring." IEEE transactions on industrial
electronics 55, no. 4 (2008): 1813-1822.diss
[242] Moazen-ahmadi, Alireza. "Vibration signatures of defective bearings and defect size estimation
methods." PhD diss. Adelaide, South Australia, 2016.

130
 TABLE DES FIGURES
FIGURE 1. 1 ROULEMENT A ROULEAUX CONIQUES ............................................................................................................ 16
FIGURE 1. 2 ROULEMENT A AIGUILLES ............................................................................................................................ 16
FIGURE 1. 3 ROULEMENT A BILLES ................................................................................................................................. 17
FIGURE 1. 4 DIFFERENT TYPES DE DEFAILLANCE DU ROULEMENT[15] .................................................................................... 18
FIGURE 1. 5 GEOMETRIE D’UN ROULEMENT : ANGLE DE CONTACT Α, DIAMETRE DU CERCLE PRIMITIF D, DIAMETRE DE L’ELEMENT
ROULANT D, 𝐃𝐢 BAGUE INTERNE, 𝐃𝟎 BAGUE EXTERNE ............................................................................................. 19
FIGURE 1. 6 SIGNAUX DE VIBRATION SUR LE ROULEMENT DANS DES CONDITIONS NORMALES, DEFAUT DE LA BAGUE INTERIEURE,
DEFAUT DE LA BAGUE EXTERIEURE ET DEFAUT DE LA BILLE[18] .................................................................................... 20
FIGURE 1. 7 DIFFERENTES METHODES DE DETECTION ET DU SUIVI DE DEFAUTS DU ROULEMENT, (A) INSPECTION PAR THERMOGRAPHIE
INFRAROUGE DU ROULEMENT A BILLES [23], (B) SYSTEMES DE MESURE LASER POUR L'INDUSTRIE [24],(C) INSPECTION
ULTRASONIQUE DEFAILLANCE DANS LES ROULEMENTS [25], (D) ANALYSE VIBRATOIRE DES MACHINES TOURNANTES [26] ...... 21
FIGURE 1. 8 FORME D’ONDE EN (A) SE TRANSFORME EN UN SPECTRE EN( B) CETTE TRANSFORMATION EST APPELEE "TRANSFORMEE DE
FOURIER RAPIDE" [47] ....................................................................................................................................... 27
FIGURE 1. 9 VIBRATIONS MESUREES SUR UN ROULEMENT AVEC DEFAUT. (A) ACCELERATION DU TEMPS, (B) SPECTRE D’ENVELOPPE[51]
...................................................................................................................................................................... 28
FIGURE 1. 10 (A) SIGNAL TEMPOREL D’ENGRENAGE, (B) CEPSTRE : LA FREQUENCE DE RECURRENCE D’UN DEFAUT[52] ................. 28
FIGURE 1. 11 LA RELATION ENTRE LES DOMAINES TEMPS ET FREQUENCE. (A) DOMAINE TEMPOREL, (B) DOMAINE FREQUENTIEL, (C)
COORDONNEES TRIDIMENSIONNELLES REPRESENTANT LE TEMPS, LA FREQUENCE ET L’AMPLITUDE ...................................... 29
FIGURE 1. 12 LA TRANSFORMEE EN ONDELETTES CONTINUE D’UN DEFAUT DE BAGUE EXTERIEURE[63]....................................... 32
FIGURE 1. 13 EXEMPLE DE DETECTION DES DEFAUTS DE ROULEMENT PAR LA TRANSFORMEE EN ONDELETTES DISCRETE[69] ............ 33
FIGURE 1. 14 (A) SIGNAL DE VIBRATION MESURE EN CAS DE DEFAUT DE ROULEMENT DE BAGUE EXTERIEURE, (B) DEGRE DE
CYCLOSTATIONNARITE DE LA BAGUE EXTERIEURE [74] ............................................................................................... 34
FIGURE 1. 15 (A) SIGNAL MESURE, (B) SON SPECTRE, (C) ET LES QUATRE PREMIERES IMFS ISSUES DE L’EMD DU SIGNAL [81] ........ 36

FIGURE 2. 1 PROCESSUS DE LA RECONNAISSANCE DE FORMES ............................................................................................. 40


FIGURE 2. 2 REPRESENTATION D’UN RESEAUX DE NEURONES [106]..................................................................................... 42
FIGURE 2. 3 EXEMPLE D’EVOLUTION ABRUPTE ................................................................................................................. 44
FIGURE 2. 4 (A) FORMATION D’UNE NOUVELLE CLASSE AU TEMPS T2 (B) FORMATION DE DEUX NOUVELLES CLASSES B ET C
APPARAISSENT AU TEMPS T5 (C) FUSION DES CLASSES B ET C (D) SCISSION DE LA CLASSE B ............................................... 46
FIGURE 2. 5 RESUME DE LA RDF DANS LE CADRE DU DIAGNOSTIC DE DEFAUT DE ROULEMENT [1] .............................................. 46
FIGURE 2. 6 LA PROCEDURE DU MODELE FILTRE [128] X={XK𝐱𝐤=𝐱𝐤𝟏, 𝐱𝐤𝟐,…., 𝐱𝐤𝐦), K=1.2,…,M} UN ENSEMBLE DE M
INDICATEURS DANS UN ESPACE DE REPRESENTATION COMPORTANT N INDICATEURS ........................................................ 48
FIGURE 2. 7 LA PROCEDURE DU MODELE WRAPPER [128] ................................................................................................. 48
FIGURE 2. 8 LES ETAPES DE CLASSIFICATION SUPERVISEE..................................................................................................... 53
FIGURE 2. 9 STRUCTURE D’UN NEURONE ARTIFICIEL. LE NEURONE CALCULE LA SOMME DE SES ENTREES PUIS CETTE VALEUR PASSE PAR
LA FONCTION D’ACTIVATION POUR PRODUIRE SA SORTIE [169] ................................................................................... 55
FIGURE 2. 10 EXEMPLE D’HYPERPLAN POUR UN SVM FORME SUR DEUX CLASSES[179] ............................................................ 56
FIGURE 2. 11 DIAGNOSTIC DES DEFAUTS DE ROULEMENTS PAR ARBRE DE DECISION [184] ......................................................... 57
FIGURE 2. 12 DENDROGRAMME DE LA CLASSIFICATION HIERARCHIQUE ASCENDANTE [206] ..................................................... 59
FIGURE 2. 13 (A) REPRESENTATION DE LA DISTANCE-NOYAU 𝐶𝑑, DE LA DISTANCE D'ACCESSIBILITE, 𝑅𝑑 POUR 𝑴𝒊𝒏𝑷𝒕𝒔 =4. (B)
EXTRACTION DE DEUX CLUSTERS PAR LE DIAGRAMME « REACHABILITY PLOT ». .............................................................. 63

FIGURE 3. 1 ARCHITECTURE DE LA CLASSIFICATION DYNAMIQUE .......................................................................................... 68


FIGURE 3. 2 ARCHITECTURE DE LA METHODOLOGIE [233] ................................................................................................. 69
FIGURE 3. 3. ORGANIGRAMME DU DIAGNOSTIC DE ROULEMENT PAR UNE CLASSIFICATION DYNAMIQUE, METHODE D-DBSCAN [234]
...................................................................................................................................................................... 71
FIGURE 3. 4 SCHEMA D’ESTIMATION DE L’ETAT DES ROULEMENTS PAR LE RESEAU NEURONAL PROFOND [235] ............................. 72
FIGURE 3. 5 LES DIFFERENTES REPRESENTATIONS PAR LA METHODE OPTICS ......................................................................... 75
FIGURE 3. 6 ARCHITECTURE DE LA METHODE DE RECONNAISSANCE DE FORMES DEVELOPPEE. .................................................... 76

131
FIGURE 3. 7 ORGANISATION DES BOUCLES POUR IRT-OPTICS ........................................................................................... 78

FIGURE 4. 1 EXEMPLES DE SIGNAUX DE LA BAGUE EXTERIEURE : (A) A L’ETAT SAIN, (B) POUR UNE FAIBLE AMPLITUDE, (C) POUR UNE
AMPLITUDE ELEVEE PERMETTANT DE VISUALISER LES CHOCS REPETITIFS......................................................................... 88
FIGURE 4. 2 EFFET DE LA VITESSE, IRT-OPTICS : (A) BPFO AVEC LA METHODE ACPK, (B) BPFO AVEC LA METHODE ACP ............ 89
FIGURE 4. 3 EFFET DU FACTEUR D’AMORTISSEMENT, IRT-OPTICS : (A) AVEC LA METHODE ACPK, (B) AVEC LA METHODE ACP...... 89
FIGURE 4. 4 EFFET DU AMPLITUDE, IRT-OPTICS AVEC LA METHODE ACP (A) SIGNAL N°20, (B) SIGNAL N°30, (C) SIGNAL N°40, (D)
SIGNAL N°210 .................................................................................................................................................. 90
FIGURE 4. 5 EFFET DE L’AMPLITUDE, IRT-OPTICS AVEC LA METHODE ACPK (A) SIGNAL N°20, (B) SIGNAL N°30, (C) SIGNAL N°40,
(D) SIGNAL N°210 ............................................................................................................................................. 91
FIGURE 4. 6 METHODOLOGIE IRT-OPTICS, LE SUIVI DES DEFAILLANCES SE REFERE A (A) LA DISTANCE (B) LE CONTOUR (C) LA DENSITE
...................................................................................................................................................................... 91
FIGURE 4. 7 𝜺 EN FONCTION DE 𝑴𝒊𝒏𝑷𝒕𝒔 POUR UN BRUIT DE NIVEAU 𝟎. 𝟏𝐛𝐭 ...................................................................... 93
FIGURE 4. 8 EFFET DE LA VITESSE, AOC-OPTICS METHODOLOGIE AVEC 1020 SIGNAUX : (A) LA METHODE T-SNE,(B) LA METHODE
ACPK ............................................................................................................................................................. 94
FIGURE 4. 9 EFFET DE L’AMORTISSEMENT, AOC-OPTICS AVEC 1020 SIGNAUX : (A) LA METHODE T-SNE, (T), (B) LA METHODE ACPK
...................................................................................................................................................................... 95
FIGURE 4. 10 METHODOLOGIE AOC-OPTICS, EFFET DE L’AMPLITUDE POUR 0.1B(T) AVEC T-SNE (A) SIGNAL N°200, (B) SIGNAL
N°220, (C) SIGNAL N°1020 ................................................................................................................................ 96
FIGURE 4. 11 METHODOLOGIE AOC-OPTICS, EFFET D’AMPLITUDE 0.1B(T) AVEC ACPK (A) SIGNAL N°200, (B) SIGNAL N°220 (C)
SIGNAL N°1020 ................................................................................................................................................ 96
FIGURE 4. 12 METHODOLOGIE AOC-OPTICS, EFFET D’AMPLITUDE 0.3B(T) AVEC T-SNE (A) SIGNAL N°220, (B) SIGNAL N°240, (C)
SIGNAL N°1020 ................................................................................................................................................ 96
FIGURE 4. 13 METHODOLOGIE AOC-OPTICS, EFFET D’AMPLITUDE 0.3B(T) AVEC ACPK (A) SIGNAL N°200, (B) SIGNAL N°220, (C)
SIGNAL N°1020 ................................................................................................................................................ 96
FIGURE 4. 14 METHODOLOGIE AOC-OPTICS, EFFET D’AMPLITUDE 0.5B(T) AVEC T-SNE (A) SIGNAL N°200, (B) SIGNAL N°240, (C)
SIGNAL N°1020 ................................................................................................................................................ 97
FIGURE 4. 15 METHODOLOGIE AOC-OPTICS, EFFET D’AMPLITUDE 0.5B(T) AVEC ACPK (A) SIGNAL N°220, (B) SIGNAL N°240, (C)
SIGNAL N°1020 ................................................................................................................................................ 97
FIGURE 4. 16 METHODOLOGIE AOC-OPTICS, SUIVI DU CLASSE 𝐂𝟏, (A) CALINSKI-INDEX, (B) DAVIES-BOULDIN INDEX. (C) DENSITE,
(D) CONTOUR, (E) DISTANCE ............................................................................................................................... 98
FIGURE 4. 17 (A) BANC D’ESSAIS, (B) ROULEMENT A ROULEAUX N.206.E. G15,(C) EXEMPLE DE DEFAUT ET (D) PROFILOMETRE AVEC
PATE PLASTIFORMTM ...................................................................................................................................... 100
FIGURE 4. 18 (A) DEFAUT APRES 9 HEURES, (B) DEFAUT APRES 118 HEURES........................................................................ 101
FIGURE 4. 19 METHODOLOGIE IRT-OPTICS, VALIDATION EXPERIMENTALE AVEC ACPK (A) SIGNAL N°48, (B) SIGNAL N°49, (B)
SIGNAL N°432 ................................................................................................................................................ 102
FIGURE 4. 20 METHODOLOGIE IRT-OPTICS, VALIDATION EXPERIMENTALE AVEC ACP(A) SIGNAL N°48, (B) SIGNAL N°49, (B) SIGNAL
N°432 .......................................................................................................................................................... 102
FIGURE 4. 21 METHODOLOGIE IRT-OPTICS, SUIVI DE LA CLASSE 𝐂𝟐 DETECTE : EVOLUTION DE (A) LA DISTANCE, (B) DU CONTOUR ET
(C) DE LA DENSITE ............................................................................................................................................ 102
FIGURE 4. 22. METHODE EXPERIMENTALE PROPOSEE PAR RT-OPTICS AVEC ACP (A) SIGNAL N°48, (B) SIGNAL N°49, (C) SIGNAL
N°50, (D) SIGNAL N°432 ................................................................................................................................. 103
FIGURE 4. 23. METHODE EXPERIMENTALE PROPOSEE PAR RT-OPTICS AVEC ACPK (A) SIGNAL N°48, (B) SIGNAL N°49, (C) SIGNAL
N°50, (D) SIGNAL N°432 ................................................................................................................................. 104
FIGURE 4. 24 COMPARAISON DU SUIVI DE DEFAUT PAR LES EVOLUTIONS, (A) DE LA DISTANCE, (B) DU CONTOUR, (C) DE LA DENSITE 104
FIGURE 4. 25 METHODOLOGIE AOC-OPTICS, VALIDATION EXPERIMENTALE AVEC T-SNE (A) SIGNAL N°80-SAIN, (B) SIGNAL N°88-
DEFAUT, (C) SIGNAL N°720-DEFAUT .................................................................................................................. 106
FIGURE 4. 26 METHODOLOGIE AOC-OPTICS, VALIDATION EXPERIMENTALE AVEC KPCA (A) SIGNAL N°80-SAIN, (B) SIGNAL N°88-
DEFAUT, (C) SIGNAL N°720-DEFAUT .................................................................................................................. 106
FIGURE 4. 27 METHODOLOGIE AOC-OPTICS, SUIVI DE LA CLASSE DETECTEE : EVOLUTION DE (A) L’INDICE DE CALINSKI, (B) L’INDICE
DE DAVIES-BOULDIN, (C) DE LA DENSITE, (D) DU CONTOUR, (E)DE LA DISTANCE ........................................................... 107
FIGURE 4. 28 METHODOLOGIE AOC-OPTICS, VALIDATION EXPERIMENTALE AVEC T-SNE. (A) SIGNAL N°136-SAIN (111 H DE
FONCTIONNEMENT), (B) SIGNAL N°140-DEFAUT (112H), (C) SIGNAL N°272-DEFAUT (118H25) .................................. 108

132
FIGURE 4. 29. METHODOLOGIE AOC-OPTICS, SUIVI DE LA CLASSE 𝐂𝟐, (A) CALINSKI INDEX, (B) DAVIES-BOULDIN INDEX,.......... 108

133
 LISTE DES TABLEAUX
TABLEAU 1. 1 LES DIFFERENTES TECHNIQUES D’ANALYSE DU SIGNAL ..................................................................................... 23
TABLEAU 1. 2 INDICATEURS STATISTIQUES DANS LE DOMAINE FREQUENTIEL........................................................................... 27
TABLEAU 1. 3 INDICATEURS STATISTIQUES DANS LE DOMAINE TEMPS ECHELLE ........................................................................ 33

TABLEAU 2. 1 AVANTAGES ET INCONVENIENTS DES DIFFERENTES DISTANCES UTILISEES. X ET Y SONT DES VECTEURS DE INDICATEURS. 64

TABLEAU 3. 1 INDICATEURS TEMPORELS ET FREQUENTIELS UTILISES PAR LA METHODE D-DBSCAN [234] ................................... 71
TABLEAU 3. 2 LES DIFFERENTS TYPES D’INDICATEURS POUR LA METHODE BASEE SUR LE RESEAU NEURONAL PROFOND [235]. .......... 72
TABLEAU 3. 3 PERFORMANCES DE CLASSIFICATION POUR LES TROIS ENSEMBLES D’INDICATEURS CALCULES AVANT LA SELECTION PAR
AG. ................................................................................................................................................................ 73
TABLEAU 3. 4 METHODES DE REGROUPEMENT ET DE CLASSIFICATION [237] ......................................................................... 74
TABLEAU 3. 5 EXTRACTIONS DANS LES DOMAINES TEMPOREL, FREQUENTIEL ET TEMPS-FREQUENCE............................................ 79
TABLEAU 3. 6 PSEUDOCODE POUR LA METHODE AOC-OPTICS .......................................................................................... 81
TABLEAU 3. 7 INDICATEURS CALCULES............................................................................................................................ 82
TABLEAU 3. 8 IRT-OPTICS ET AOC-OPTICS ................................................................................................................. 84

TABLEAU 4. 1 DIMENSIONS DU ROULEMENT SKF6206 ..................................................................................................... 87


TABLEAU 4. 2 CARACTERISTIQUE SIMULEE ...................................................................................................................... 88
TABLEAU 4. 3 RESULTATS DE LA DETECTION DE DEFAUTS. N : NON-DETECTION DE DEFAUT ; D : DETECTION DU DEFAUT. ................ 91
TABLEAU 4. 4 PARAMETRES DE SIMULATION ................................................................................................................... 92
TABLEAU 4. 5 EFFET DE 𝑴𝒊𝒏𝑷𝒕𝒔 SUR LE TEMPS DE DETECTION, AVEC LA DISTANCE EUCLIDIENNE, 17 INDICATEURS, 𝜺 =0,094. .... 93
TABLEAU 4. 6 EFFET DES DISTANCES, AVEC 𝑀𝑖𝑛𝑃𝑡𝑠 = TH2, 17 INDICATEURS, 𝜀 = 0.094 ................................................. 93
TABLEAU 4. 7 PRECISION GLOBALE. EFFET DES INDICATEURS DE CLASSEMENT AVEC LA DISTANCE DE MANHATTAN, 𝑴𝒊𝒏𝑷𝒕𝒔 = 𝐓𝐡𝟐,
𝜺 = 𝟎. 𝟎𝟗𝟒 ................................................................................................................................................... 94
TABLEAU 4. 8 DIMENSIONS DES DEFAUTS : RUGOSITE ARITHMETIQUE (RA) ET UNE RUGOSITE TOTALE (RT) POUR LE BANC D’ESSAI (
FIGURE 4.17) ................................................................................................................................................. 101
TABLEAU 4. 9 COMPARAISON ENTRE IRT-OPTICS ET RT-OPTICS ................................................................................... 105

134
 LISTE DES ALGORITHMES
ALGORITHME 2. 1 PSEUDOCODE DE SELECTION DE RELIEF [128] ......................................................................................... 49
ALGORITHME 2. 2 ARCHITECTURE DE ACP A L’AIDE DE LA METHODE DE MATRICE DE COVARIANCE [138]. ................................... 50
ALGORITHME 2. 3 ARCHITECTURE DE L’ALGORITHME ONLINE-KPCA [144] .......................................................................... 51
ALGORITHME 2. 4 T- DISTRIBUTION DE PROBABILITE ENTRE POINTS VOISINS (T-SNE)[145]. ..................................................... 52
ALGORITHME 2. 5 LE PSEUDOCODE DE K PLUS PROCHES VOISINS (K-NN)[157]. .................................................................... 54
ALGORITHME 2. 6 LE PSEUDOCODE DE LA METHODE NAÏVE BAYESIENNE[166]. ...................................................................... 54
ALGORITHME 2. 7 LE PSEUDOCODE DE SVM [177] ......................................................................................................... 56
ALGORITHME 2. 8 PSEUDOCODE DE LA CLASSIFICATION PAR PARTITION K-MEANS [203]. ......................................................... 59
ALGORITHME 2. 9 PSEUDOCODE GENERALE DES METHODES HIERARCHIQUES[207]................................................................. 59

135
Contribution au processus de surveillance intelligente des machines tournantes : cas des roulements à billes.

La production industrielle est actuellement déterminée par la concurrence mondiale et la nécessité d'adapter rapidement la
production aux demandes du marché en évolution constante. Ces exigences ne peuvent être satisfaites que par des avancées
radicales dans les technologies de fabrication actuelles. L'industrie 4.0 est une approche intéressante basée sur l'intégration des
processus d'entreprise et de fabrication. L’objectif de cette thèse est de développer une méthodologie de la maintenance 4.0 pour
briser les compromis des anciennes stratégies en permettant aux entreprises de maximiser la vie utile de leurs équipements de
production tout en évitant les temps d'arrêt imprévus, par combinaison de l’analyse vibratoire et la méthode de reconnaissance
de formes pour détecter, et suivre la dégradation d’un défaut. Deux procédures sont proposées, IRT-OPTICS (Improved Real-Time
Ordering Points to Identify the Clustering Structure) et AOC-OPTICS (Automatic Online Classification monitoring based on OPTICS),
basées sur la méthode de reconnaissance de formes non supervisée. Ces méthodes devraient aboutir à une surveillance
autonome. Elles visent à déceler les dysfonctionnements des machines tournantes et de suivre l’évolution de ce
dysfonctionnement. Cette démarche commence par l’extraction de trois types d’indicateurs (scalaires, temps-fréquence, temps-
échelle), suivie par une réduction de dimension dans un espace visuel, représentant la présence de défauts dans le roulement.
L'étape suivante consiste à suivre l’évolution de la dégradation en utilisant cinq paramètres : Davies-Bouldin index, Calinski-index,
le saut du centre de la classe, la densité, le contour.

Mots-clefs : L’industrie 4.0, l’analyse vibratoire, reconnaissance de formes, IRT-OPTICS, AOC-OPTICS

Contribution to the process of smart monitoring of rotating machines: the case of ball bearings.

Industrial production is currently determined by the global competition and the need to adapt the production quickly
to changing market demands. These requirements can only be met by radical advancements in the current
manufacturing technologies. Industry 4.0 is an interesting approach based on the integration of business and
manufacturing processes. The objective of this thesis is to develop a methodology of maintenance 4.0 to break the
trade-offs of old strategies by allowing companies to maximize the useful life of their production equipment while
avoiding unplanned downtime, by combining vibration analysis and pattern recognition methods to detect and track
the degradation of a defect. Two methodologies proposed IRT-OPTICS (Improved Real-Time Ordering Points To Identify
the Clustering Structure) and AOC-OPTICS (Automatic Online Classification monitoring based on OPTICS), based on the
unsupervised pattern recognition method. These methods should lead to autonomous surveillance. They aim to detect
the malfunctions of rotating machines and to monitor the evolution of this malfunction. This starts with the extraction
of three types of indicators (scalar, time-frequency, time-scale), followed by a dimensional reduction in a visual space,
representing the presence of defects in the bearing. The next step is to follow the evolution of the degradation using
five parameters: Davies-Bouldin index, Calinski-index, jump from the centre of the class, density, contour.

Keywords: Industry 4.0, vibration analysis, pattern recognition, IRT-OPTICS, AOC-OPTICS.

Discipline : MÉCANIQUE, AUTOMATIQUE, ROBOTIQUE, TRAITEMENT DU SIGNAL

Université de Reims Champagne-Ardenne


UFR Sciences Exactes et Naturelles
EA 7548 ITheMM
EA 3804 CRESTIC
Campus du Moulin de la Housse -51687 Reims Cedex 2