processus métiers
El Haddadi Anass, Atahran Ahmed, Ebobissé Yves, B. Bounabat
anass.elhaddadi@gmail.com , atahran.ahmed@gmail.com , ebobisseyves@yahoo.fr , bounabat@ensias.ma
Résumé
L’article décrit une étude comparative par critères des outils de cartographie des processus
métiers, en se basant sur un processus de data mining. L’objectif est de collecter, analyser
plus efficacement les besoins des clients en terme de critères pour un outil de cartographie de
processus métiers, afin de lui présenter des offres qui correspondent le mieux à ses choix et
regrouper les acteurs du marché en classes.
1
notre étude comparative, 70 critères à d’autres formats et standards et de leur
prendre en compte au cours de la sélection restitution, de l’optimisation et du test
d’outils de cartographie ont été regroupés d’alternatives.
en quatre grandes familles : Ceci n’est qu’un bref aperçu des critères à
- Hardware & Software : prendre en compte.
Elle prend en compte les aspects de codage 2– Démarche d’analyse et classification
(support de paradigme objets, design Le marché offre une variété d’outils
pattern, disponibilités du code source, la opensource (OpenEbXML, Werkflow,
présence de fonctions prédéfinies) utiles OSWorkflow, Apache OFBiz, Xflow,
notamment du point de vue informaticien Intalio, Yawl) et propriétaires tels que Aris
ou développeur amené à donner un produit Business Architect (IDS Scheer),
sur mesure aux besoins de l’entreprise. BusinessWare (Vitria Technology),
Elle tient également compte de la AXway Integration Broker (aXway),
compatibilité avec le patrimoine de Agilium (Agilium), OnMap Suite
l’entreprise en terme de systèmes (OnMap), Up Easy Pilot (Softandem ),
d’informations (applications héritées, MEGA (MEGA International),
tableurs, SGBDRs, etc …), le support Provision Entreprise ( Proforma
fourni au travers de la documentation, de Corporation), Witness ( Lanner Group),
conseils, de démos et tutoriels, plans de Win’Design Business Process (Cecima).
formation, les considérations financières et
techniques (coût de déploiement,
d’installation, upgrading du matériel, etc
…), le pedigree de la société éditrice
(réputation, âge, position sur le marché …)
- Capacités de modélisation :
Dans cette catégorie, on citera notamment
le degré d’expertise requis pour
l’utilisateur, la facilité de prise en main, la
représentativité des modèles vis-à-vis de la
réalité, mais également la modularité
(développer des portions de processus de
manières indépendantes voire concurrente),
l’aide à la production de documentation.
2
Si le travail de la Gartner est reconnu, il scientifiquement éprouvés. Sur la base de
spécifie cependant qu’il n’est en aucun cas ces modèles, pour tout nouveau client, il
utile pour la sélection d’un outil et un futur lui suffira de fournir son questionnaire
utilisateur est donc laissé une fois de plus à dûment rempli pour lui prédire la classe
sa fin. d’outils qui serait susceptible de
Aussi, à partir des critères mentionnés l’intéresser. Dans cette démarche, une fois
plus haut, dans les travaux précédents nous les données reçues, il faut préparer les
avons pensé à l’utilisation de techniques données, comprendre les données, en
d’analyse de classification automatique définissant par exemple des codifications,
non seulement de documents textuels préparer les données en remplaçant les
numériques text mining [GRI, 07] mais champs qui n’ont pas été mentionnés soit
plus généralement de Datamining et d’aide par des valeurs moyennes, ou des 0 ou des
à la décision. Elles combinent des 1. Puis effectuer la classification en
approches issus des discipline comme la produisant un modèle.
linguistique informatique (analyse de texte
et extraction d’information), l’analyse de Recodage des résultats des critères :
données (analyse factorielle, classification, Les notes des critères dans le document
…), l’intelligence artificielle (techniques initial sont exprimés en terme de High,
d’apprentissage, règles d’inférences) et les medium, low ou encore possible, not
sciences de l'information (lois possible. Nous avons premièrement
bibliométriques). retranscrit ces possibilités en High – H,
Démarche Medium – M, Possible - 1, not possible – 0
Dans notre démarche de collecte et etc …
d’analyse en suit la méthodologie CRISP- Une fois ceci effectué, nous pouvons
DM (Cross-Industry Standard Process for maintenant passer à la classification sur la
Data Mining). base d’un échantillon, qui est traduit sous
forme de fichier plat, ou excel.
Classification
Ces méthodes sont généralement utilisées
pour grouper des objets, des personnes, des
concepts ou des stimuli dans des groupes
homogènes sur la base de leur similarité.
Dans notre cas il s’agira d’outils BPM.
Lorsqu’on cherche à identifier les
principales thématiques abordées dans un
ensemble de documents et plus
généralement dans l’analyse de données,
deux approches [GRI, 07] sont possibles
pour regrouper des documents similaires:
- La classification supervisée ou
catégorisation qui consiste à identifier la
Figure 2 : CRISP-DM (Source : SPSS) classe d’appartenance d’un objet à partir de
certains traits descriptifs. Cette approche
Il s’agit de prendre les critères initiaux, permet le classement automatique de
soumettre un questionnaire à un large documents, fichiers dans des classes
public utilisant les outils de cartographie préexistantes (connues à l’avance), comme
puis, appliquer les techniques de par exemple les rubriques d’un journal
classification liées à l’analyse de données (société, sport, politique). Les méthodes les
afin de produire des modèles plus efficaces sont basées sur un corpus
3
d’apprentissage. Elles permettent de Les réseaux de Neurones et Kohonen :
déterminer automatiquement la catégorie [Barthelemy] sont un ensemble de
d’un fichier à partir d’échantillons de pour cellules connectées entre eux par des
chaque catégorie choisie. liaisons affectés par un poids. Les liaisons
- La classification non supervisée des permettent à chaque cellule de disposer
fichiers et résultats ou clustering, c’est à d'un canal pour envoyer et recevoir des
dire la découverte de classes de documents signaux en provenance d'autres cellules du
sans a priori, (on ne connaît pas les classes réseau. Chacune de ces connexions reçoit
à l’avance). Comme dans toute approche un poids (une pondération), qui détermine
non supervisée, ces méthodes supposent le sont impact sur les cellules qu'elle
choix : connecte. Chaque cellule dispose ainsi
- d’une représentation des objets à classer d'une entrée, qui lui permet de recevoir de
- d’une mesure de similarité entre les l'information d'autres cellules, mais aussi
objets de ce que l'on appelle une fonction
- d’un algorithme de classification d'activation, qui est dans les cas les plus
(hiérarchique ou non hiérarchique) simple, une simple identité du résultat
(Exemple : K-means, réseaux de Kohonen obtenu par la l'entrée et enfin une sortie.
ou méthodes Two Steps).
4
jusqu'à ce que le nombre maximal Les enregistrements sont rassemblés dans
d'itérations soit atteint ou que le le même groupe ou la même classe.
changement produit par une nouvelle
itération soit inférieur à un seuil défini.
Application de la démarche
Comme première comparaison on a fait des bancs d’essai sur sept outils : Visio, Rational
Rose, Power Designer, Méga, INTALIO et JBPMN.
5
Figure 6 : Modélisation
Après exécution, nous sortons avec ce regroupement qui nous permet de constater que les
outils Intalio et JBPM appartiennent à la même classe, de même que rational rose et
Objectering.
L’analyse du graphique sous dessous nous permet par exemple de constater que Méga est le
seul qui nous ait permis de faire une animation et qui a une qualité de graphique excellente.
Alors qu’Objectering est gratifié du même degré graphique sans pour autant faire d’animation.
6
Ainsi, à partir d’un large échantillon, on peut constituer un modèle d’apprentissage et pour
tout nouveau client qui désire choisir un outil vi à vis d’un critère donné, il suffit d’entrer ses
réponses pour lui donner les outils qui répondront le mieux.
Conclusion et perspectives
Nous avons pu appliquer les techniques de échantillon de réponses, de personnes et
datamining à la sélection d’outils. Ce acteurs divers du milieu de la cartographie
travail peut être exploité par une entreprise de processus. En plus de cela, nous
de e-commerce qui propose par exemple n’avons pas effectué de tests pour savoir si
des solutions de cartographie, pour K-means était l’algorithme le plus
déterminer le profil des utilisateurs et lui approprié pour pouvoir par la suite faire
fournir en ligne des solutions qui peuvent des prédictions des préférences. Enfin,
être susceptibles de l’intéresser. Cette nous n’avons pas entièrement implémenté
démarche repose sur des concepts la suite de la démarche CRISP-DM. Une
scientifiques et modèles mathématiques meilleure analyse des tableaux obtenus
éprouvés. Cependant, il faut reconnaître ferait ressortir davantage de résultats
que ce travail est limité car il faudrait pertinents.
préalablement disposer d’un vaste
Bibliographie :