Académique Documents
Professionnel Documents
Culture Documents
Union-Discipline -Travail
Présenté par :
JURY
PRESIDENT : Dr SILUE
RAPPORTEUR : M. KOUAKOU STEPHANE
ASSESSEUR : ..
MEMBRE : …
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
DEDICACE
I
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
AVANT-PROPOS
Pour notre part, nous somme issue de la filière de Statistique et économie appliquée (SEA).
Cette formation est complétée en fin de cycle par un séjour d’au moins trois mois en
entreprise afin de confronter les connaissances théoriques acquises avec les réalités des
entreprises. C’est ainsi que nous avons effectué un stage de trois mois au sein de l’entreprise
CFAO Retail en tant que data analyste junior, agent Référentiel pour l’élaboration de notre
projet de Fin d’étude délivré sous la forme d’un mémoire de fin d’étude et sera soutenu
publiquement devant un jury composé d’éminents professeurs en vue de l’obtention de notre
diplôme de licence en Statistique et économie appliquée. Au cours de ce stage, il nous a été
demandé d’apporter notre aide en ce qui concerne le traitement des anomalies du référentiel.
II
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
III
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Figure 8 : UL Manquant…………………………..………………………………………12
IV
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
V
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
SOMMAIRE
INTRODUCTION GENERALE……………………………………………………………………………..……………………………...1
CFAO GROUP…………………………………….…...………………………………..............................3
BASE DE DONNEES……………………………………..............................................................9
REVUE DE LITTERATURE……….…………………………………………………………………..………….11
CONCLUSION PARTIELLE…………………………………………………………….....................................................14
CONCLUSION GENERALE…………………………………………………………..…......................................................33
VI
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
REMERCIEMENTS
L’achèvement de ces 3 années d’étude par ce stage ainsi que la réalisation de ce présent
document n’aurait été possible sans l’aide et le soutien inconditionnel de personnes très
importantes pour nous.
Pour cela, nous tenons sincèrement à exprimer notre immense gratitude à l’endroit de toutes
ces personnes.
En premier lieu, nous souhaitons remercier Mr Karamoko Abdoulaye, Président de
l’université Polytechnique de Bingerville, pour ses actions et son soutien en notre faveur
Nous Tenons également à remercier notre professeur encadreur, Dr Gnoudentiho Silué, pour
ses connaissances et son temps partagés.
Enfin, nous adressons un très grand remerciement à tous nos collègues de services notamment
Maella Dosso, Innocente Konan, Sylla nalima, Franck ASSAMOI, Océane DOUBAHI,
Mariam CISSE Ainsi qu’à toute son équipe du service TRANSIT, pour leurs expériences,
savoir partagés et leur soutien à notre à notre égard.
VII
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
RESUME
L'objectif principal de cette étude était de mettre en place une solution de détection
d'anomalies dans le référentiel de la société CFAO RETAIL afin de répondre au problème
de données erronées mises à disposition de l’entreprises. Pour ce faire et pour les besoins
de l'entreprise, nous avons développé ladite solution sous Microsoft ACCES automatisée
avec le langage VBA ainsi que par quelques requêtes SQL pour la détection d'anomalies.
Bien avant cela, nous avons procédé à une description préliminaire de la base de données
en question ainsi que des éventuelles anomalies à traiter. Pour cela, nous avons utilisé des
statistiques descriptives pour décrire les différents états des données et effectué des tests
statistiques afin de vérifier notre hypothèse selon laquelle notre solution réduirait le
nombre d’anomalie journalier. Les principaux résultats de cette analyse statistique ont
montré que les anomalies de type "valeurs manquantes" étaient significativement moins
traitées que celles de type "erreur de paramétrage", la mise en place de notre solution de
données automatiques a donc eu un impact positif sur l'état des données dans le sens où
cette solution permet de gagner du temps dans la détection des anomalies des deux types.
ABSTRACT
The main objective of this study was to implement an anomaly detection solution in the
CFAO RETAIL company repository in order to respond to the problem of erroneous data
made available to companies. To do this and for the needs of the company, we have
developed the said solution under Microsoft ACCES automated with the VBA language as
well as by some SQL queries for the detection of anomalies. Long before that, we carried out
a preliminary description of the database in question as well as any anomalies to be dealt
with. For this, we used descriptive statistics to describe the different states of the data and
performed statistical tests to verify our hypothesis that our solution would reduce the
number of daily anomalies. The main results of this statistical analysis showed that
anomalies of the "missing values" type were significantly less processed than those of the
"parameterization error" type. The implementation of our automatic data solution therefore
had a positive impact on the data status in the sense that this solution saves time in
detecting anomalies of both types.
VIII
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
INTRODUCTION GENERALE
Les données qu’une entreprise possède sont le fruit d’un ensemble de processus plus ou moins
complexes. Ces données proviennent des différents systèmes d’information de l’entreprise et
sont utilisés par des analystes, mais aussi par les autres services, tels que le Marketing, la
production, de la comptabilité ou des ventes. C’est donc dire que ces données ont une très
haute importance dans les tâches courantes des entreprises. Malheureusement, ces données
mise à disposition des entreprises sont très souvent inapproprié car entaché d’erreur faussant
ainsi les analyses et les décisions prises sur la base de ces données. Et ce, parce qu’il n’existe
pas de processus de contrôle et de validation des données pour ces entreprises.
La qualité des données est de plus en plus un sujet assez préoccupant pour beaucoup de
dirigeant de nos jours. Plusieurs études statistiques nous renseigne à ce sujet notamment
Forbes Insights et « 2016 Global CLO Outlook » de KPMG, qui montrent que 84% des
dirigeants s’inquiètent de la qualité des données qu’ils utilisent pour leur veillent économique.
Une étude auprès de 600 personnes impliquées en intelligence d’affaires a démontré que 35
pour cent de ses utilisateurs considèrent la piètre qualité des données comme faisant partie
d’une de leurs trois principales préoccupations pour les prochains 12 à 18 mois. Une
étonnante étude menée par MIT Sloan indique que les données de mauvaises qualités peuvent
couter en moyenne entre 15 et 25% du chiffre d’affaires. Cela dit, la problématique de la
piètre qualité des données doit être considéré avec haute importance. Disposer de données
d’excellente qualités deviens alors un véritable luxe pour les entreprises d’Aujourd’hui.
Pour les entreprises de la grande Distribution, le souci apparait beaucoup plus conséquent. Car
des données erronées sur les prix, les quantités en stock, ou même la disponibilité des articles
aura un impact direct sur les ventes de l’entreprises.
CFAO RETAIL, une multinationale de grande distribution implantée en côte d’ivoire entend
se hisser au rang des leaders du secteur en côte d’ivoire, voire en Afrique. Pour cela,
l’entreprise dispose d’une direction Organisation Système et Supply Chain ayant pour rôle le
pilotage des approvisionnements, la gestion des stocks, ainsi que la gestion de la base de
données fonctionnelle de l’entreprise. Cependant lorsque les données mise à la disposition de
la supply Chain et de toute l’entreprise sont erronées et de mauvaise qualité, on assiste à des
IX
1
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
problèmes tel que le surstock, les ruptures de stocks ou encore la non disponibilité des articles
en magasin pour le client final. Provoquant par la suite un manque à gagner ou des difficultés
à écouler le surstock.
C’est dans cette optique que nous, étant stagiaire au sein du service Base de données de
l’Organisation Système et Supply Chain de CFAO Retail CI et ayant appris des méthodes et
techniques de traitement de données au cours de notre formation, somme solliciter afin de
solutionner le problème.
Nous faisons donc face à la problématique suivante : Comment détecter ces anomalies de
façon automatique dans la base de données et les corriger par la suite ?
Notre Objectif général étant donc d’anticiper la présence de ses anomalies avant qu’advienne
des problèmes de surstocks, de rupture de stock ou d’indisponibilité d’article en magasin
provoqués par ces anomalies.
- Identifier un moyen de vérification des données avant leurs intégrations dans la base
de données.
Pour la mise en œuvre de ce travail, nous chercherons d’abord à identifier la source des
anomalies par des entretiens semi-direct et des observations, nous procéderons dès lors a la
mise en œuvre de notre outil automatique de suivi des anomalies dans la base de données
ainsi que d’un moyen de vérification des données avant leurs intégrations dans le système.
Par ailleurs, après avoir présenté notre solution, nous procéderons à une évaluation de la
performance de celle-ci en faisant une analyse descriptives et comparatives du nombres
d’anomalie par jour avant activation de la solution et du nombre d’anomalie par jour à
compter de l’utilisation de la solution.
Notre travail s’articule autour deux de grande parties. La première partie traite du cadre
d’étude. Nous présentons au cours de cette partie l’environnement de travail ainsi que le cadre
théorique du sujet. La seconde partie quant à elle, présente la démarche méthodologique du
sujet ainsi que les différentes solutions au problème posé.
X
2
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Cette partie comprend deux chapitres, le premier présente l’entreprise CFAO RETAIL en
mettant en exergue le fonctionnement du service base de données.
Le deuxième chapitre traite pour sa part le cadre théorique du sujet. Nous justifierons donc
l’intérêt de l’étude et présenterons une revue de littérature du sujet.
Réalisant un chiffre d’affaire moyen annuel de plus de 6.9 milliards d’euros, avec un accès à
47 pays des 54 pays du continent africain et plus de 21 000 collaborateurs, le GROUPE
CFAO, est un acteur majeur dans les domaines de la mobilité, de la santé, des biens de
consommation, des infrastructures et de l’énergie. Partenaire de grandes marques mondiales,
le Groupe intervient sur toute la chaine de valeur importation, production, distribution selon
les meilleurs standards internationaux, en s’appuyant sur près de 170 ans de connaissance
terrain et sur les savoir-faire locaux. CFAO déploie une stratégie à la fois industrielle pour
favoriser une production locale, et de distribution à travers son réseau, le plus large d’Afrique,
pour proposer des produits et services adaptés et abordables au profit des populations. (Source
: cfaogroup.com).
3
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
En 2015, les activités, CFAO Retail sont lancées ainsi que le premier centre commercial
PlaYce à Abidjan.
4
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Source : (https://www.cfaogroup.com/wp-content/uploads/2021/10/cfao-profil-
2021.pdf)
1. Présentation
CFAO RETAIL est la division de CFAO Group opérant dans le domaine de la Grande
Distribution en Afrique.
En mai 2013, le N°2 mondial de la grande distribution Carrefour et le groupe CFAO annonce
la signature d’un protocole d’accord pour constituer une société commune détenue par CFAO
et Carrefour. Cette société multinationale de grande distribution dénommée CFAO RETAIL
est donc l’entité en charge des centres commerciaux PlaYce. Avec ses magasins Carrefour et
Supeco ainsi que quelques Clubs de marques tel que Lacoste, Jules, Beauty succès et la
Grande Récré au sein des centres commerciaux plaYce. L’entreprise décide alors de mettre en
place des magasins de distribution sous différents formats (Carrefour Hyper, Carrefour
Market et Supeco) afin de répondre au mieux aux attentes des Consommateurs.
5
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Pour une meilleure gestion de ses magasins, l’entreprise s’est doté de deux sous entités
appelés la SDA (Société de Distribution Alimentaire) en charge de la gestion des magasins
Carrefour et Supeco et la SGIC (Société de Gestion Immobilière et Commerciale) en charge
de la gestion des magasins de la galerie marchande des centres commerciaux PlaYce.
2. Historique et évolution
3. CFAO RETAIL CI
- la direction Générale
6
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
- la direction Magasin
C’est au sein de la direction OSS que nous avons effectué notre stage de fin
d’étude, en tant qu’assistant data analyst de données au sein du département
base de données et référentiel.
1. Présentation et Organisation
Comme toutes les entreprises de la grande distribution, CFAO RETAIL RCI dispose d’une
direction OSS ayant pour rôle d’assurer la disponibilité des articles en magasins et a l’entrepôt
a tout moment ainsi que de mettre à disposition de des magasins et de l’entreprises des
informations et données pertinentes sur les articles en vue d’une meilleure gestion de
l’entreprise.
On y trouve :
2. Fonctionnement de L’OSS
7
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Source : l’Etudiant
Comme présenté dans l’organigramme ci haut l’OSS est un département qui fonctionne de
façon hiérarchique partant du directeur OSS aux Agents des différents services.
Ainsi les principaux rôles des services de l’OSS CFAO RETAIL CI sont les suivantes :
Services Transit : le Services Transit pour sa part, est chargé du suivi des commandes
import. Car en effet l’entreprise s’approvisionne depuis l’import. Ainsi le rôle du service
transit est de superviser toutes les importations pour le compte de la SDA RCI et de la SGIC
et veiller au bon déroulement des actions et procédure menés jusqu’à la livraison des
conteneurs.
Service Entrepôt : le Service de l’entrepôt dirigé par un responsable entrepôt, est les services
chargés de la réception et stockés les articles venant des fournisseurs locaux ainsi que
commandés depuis l’Import. Ce service s’assure également de la bonne gestion des articles
stockés a l’entrepôt en approvisionnant les magasins si besoin est. Pour notre part, l’entrepôt
de l’entreprise CFAO RETAIL CI appelé AERIA est situé à Port bout, derrière l’Aéroport
Internationale FHB.
Services Base de données et Référentiel : C’est au sein de ce Services que nous avons
effectué notre stage de fin d’étude. Comme son nom l’indique, c’est le Services en charge de
la gestion de la base de données et du Référentiel de tous les magasins. Il est donc le service
garant des informations sur les articles et fournisseurs de CFAO RETAIL CI. Son rôle
principal est donc d’effectuer toutes les mises à jour dans la base de données et tout en
s’assurant du bon référencement des articles en fournisseurs dans cette base de données.
Analyste de données : l’analyste de données de l’OSS, est celui qui guide de par ces analyses
de la base de données et du Référentiel les décisions du directeurs OSS et de toute
8
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
l’entreprise. Il est ainsi chargé de réaliser des rapports d’analyses et des reportant périodique
mis à la disposition de toute l’entreprise.
La Base de données étant non seulement le garant de la fiabilité des informations sur les
articles en magasins est également le support de décisions de toute l’entreprise.
Par ailleurs ces services sont subdivisés en deux sous-service qui sont ; la Base de données et
le Référentiel fonctionnant presque tout le temps ensemble mais avec des priorités bien
différentes.
a) Base de données.
Cette entité du service base de données et référentiel est chargé principalement de créer
les nouveaux articles ainsi que les nouveaux fournisseurs dans la base de données et
d’effectuer les mises à jours sur les prix de ventes, les prix d’achat, le PCB1
venant pour la plupart des acheteurs, et tout autre informations sur les articles. Aussi, la
base de données est chargée du paramétrage des actions commerciales et opération de
promotion étant donné que c’est une tâche touchant les prix. Cette entité est à ce jour gérer
par deux agents Base de données.
b) Le Référentiel
9
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
junior. Par ailleurs, nous avons servis d’auxiliaire également à la Base de données lorsque
besoins était.
I. REVUE DE LA LITTERATURE
Nous verrons dans cette rubrique, ce que dit la littérature à propos des données, des anomalies
sur les données et les méthodes utilisées à ce jour pour le traitement de ces anomalies. Outre
cela, nous verrons une approche définitionnelle des concepts clés de notre travail.
C’est un secteur aujourd’hui en plein essor en Côte d’Ivoire. Il enregistre une croissance de
7% par an en moyenne (Mieu, 2014). Avec un chiffre d’affaires annuel de près de 800
milliards de FCFA (environ 1 219 512 195 milliard d’euros), ce secteur compte parmi les plus
prospères de l’économie ivoirienne.
10
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Par ailleurs, une base de données peut être l’agencement de plusieurs tables traitant d’un sujet
commun. Sa mise en œuvre a pour but de stocké un ensemble d’information chiffré afin de la
rendre disponible pour d’éventuelles analyses.
c) La donnée
Bien que les termes donnés et information soient considérés comme pareils, il existe quand
même des distinctions à bien prendre en compte.
Une « donnée » est en quelque sorte la représentation d’une information qui est codée
dans un format numérique, parfois sous forme analogique, permettant son utilisation et
son traitement par ordinateur. Emmagasinées dans un système informatique, les données
ne sont pas des informations. Elles deviendront des informations dès qu’elles seront
décodées dans leur contexte d’utilisation. A priori, une donnée hors contexte ne fournit
pas d’information. Il s’agit simplement d’une valeur quelconque permettant de qualifier
une portion d’une entité. Par exemple une valeur numérique (adresse, quantité, âge,), un
qualificatif (couleur, sexe, ancienneté,), une valeur booléenne (0, 1, vrai, faux, oui, non).
Une fois mise en contexte, elle devient une information. Une information peut contenir
une ou plusieurs données. Par exemple, le nombre « 34 » (une donnée), il y a 34 étudiants
inscrits dans le cours STAT INF (une information).
Pour un bon traitement et une bonne analyse des données, le premier défi majeur
consiste à s’assurer de la fiabilité des données dont on dispose. Car en effet Les
données d’une base de données doivent respecter certaines règles, sous peine de
générer des anomalies.
Aussi appelé bruit ou exceptions, une valeur anormale dans une base de données est
une déviation de la donnée par rapport la tendance normale et réalisable de la base de
données.
Les anomalies sont des occurrences inattendues qui ne sont pas conformes à un
modèle standard. Elles peuvent être dues à une erreur humaine ou à une panne
d'équipement.
On distingue ainsi donc trois catégorie d’anomalies dans une base de données :
11
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
L’une présentera les grands ouvrages ayant discutés du sujet et l’autre se contenteras de
présentera les méthodes connu et utilisées à ce jour pour la détection des anomalies dans les
base de données.
La mauvaise qualité des données est néfaste à l'entreprise : performance, réactivité, coûts,
image sont directement concernés.
C’est en ce sens que Christophe BRASSEUR dans son ouvrage « Data Management,
qualité des données et compétitivité » met l’accent sur l’importance et l’impact des
données dans les systèmes de gestions des entreprises.
Selon Laure Berti-Equille la bonne qualité des données est aujourd'hui la clé de voûte de
toute organisation. La gestion et l'amélioration de cette qualité sont des tâches coûteuses et
difficiles, mais néanmoins incontournables. Dans son ouvrage intitulés « la qualité et la
gouvernance des données, au services de la performance des entreprises » il propose une
12
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
étude des différents outils et démarches qui assistent les spécialistes de la qualité et de la
gouvernance des données. A travers les expériences de la communauté francophone
animée par l'association Exquis (Excellence Qualité, Information), il présente, avec
pédagogie et pragmatisme, un panorama des concepts-clés de la gestion de la qualité des
données et leurs déclinaisons dans les entreprises (Business Intelligence, Data Qualité
Management, Key Performance Indicator, Model Driven Engineering, Master Data
Management, etc.).
Les technique mise au point à ce jour pour détecter les anomalies dans les données sont
nombreuses et basé sur des types de données différents.
On a :
- Le détecteur d’anomalie que propose Microsoft AZURE appelé « API détecteur » est
une fonctionnalité utilisable sur des données en série temporelle est un détecteur basé
sur une intelligence artificielle qui analyse les données et sélectionne le meilleur
algorithme de détection d’anomalie.
- Les algorithmes d’apprentissage automatiques pour la détection des anomalies tel
que : la régression linéaire, l’algorithme des plus proches voisin (KNN), les machines
à vecteurs de support (SVM), etc.
1. Contexte
Cette étude a pour but principal la mise en œuvre d’un outil de détection des anomalies
dans une base de données et du traitement de ces données.
Pour l’entreprise CFAO Retail, la mise en œuvre d’un tel outil apparait très bénéfique
dans le sens où il permettra à l’entreprise d’identifier continuellement les anomalies qui
seront créées dans la base de données.
13
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Ainsi cet outil assurera une certaine qualité des données de l’entreprise et réduira par
l’impact négatif sur les ventes ainsi que sur le chiffre d’affaire de l’entreprise en :
Par ailleurs, la bonne qualité des données permettra d’effectuer de bonne analyses et
pertinentes qui permettrons pas la suite la prise de meilleures décisions pour le
développement de l’entreprise.
Etant donné qu’au cours de la formation, nous avons appris à traiter et manipuler les
données à travers divers logiciel, et qu’en plus de cela nous avons par ailleurs appris à
gérer les bases de données relationnelles ou non, au moyens de plusieurs logiciels qui
exploitaient chacune le language SQL. Ce travail constitue une véritable mise en
application de tous ses apprentissages.
CONCLUSION PARTIELLE
14
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Dans cette partie, nous aborderons le cadre méthodologique de notre étude et nous
résultats de notre étude.
Ce cadre sera présenté en deux dictions. La première section présentera les différentes
méthodologies de l’étude tandis que la seconde section se contentera de présenter les
résultats et les discussions des résultats.
I. METHODOLOGIE
La solution que nous avons décidé d’établir est une solution office comme demandée.
Elle est principalement développée sous Microsoft ACCES.
1. Choix du logiciel de travail
Etant donné que les potentiels utilisateurs de l’outil que nous devons établir ne seront
pas nécessairement des amateurs dans le domaine du traitement des données. Une
solution office serait l’idéal, selon l’entreprise.
Car en effet, tous pourraient l’utilisé pour contrôler le flux de données avec lesquelles
ils travaillent au quotidien.
Parmi tant de logiciel OFFICE mis à la disposition du grand public nous avons décidé
de nous servir de Microsoft ACCES car c’est d’abord un outil de gestion des bases de
données capable de communiquer avec des requêtes SQL et de plus, l’on a la capacité
de l’automatiser aux moyens du langage VBA.
15
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
La base de données référentiel est la base de données qui contient les informations sur
tous les articles référencés dans le système de CFAO RETAIL.
Avec les articles en lignes et les variables en colonnes, elle nous renseigne sur les
informations tel que le code article, la désignation, le prix tarif, le prix de vente, la
variante, le mode d’approvisionnement. Pour ne citer que ceux-là.
16
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Source : L’étudiant
L’accès à la base de données PAYS est un processus très simple. En effet, CFAO
RETAIL dans son fonctionnement dispose d’un Progiciel de gestion Appelé
« METI ». C’est donc par ce progiciel que nous obtenons la base de données du jours
en réalisant une extraction de fichiers au format CSV.
La base de données est mise à jour tous les jours selon que des modifications lui soit attribué.
Dans la suite de notre étude, nous utiliserons la base de données du 05/11/2022.
17
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Lorsque ces valeurs n’existent pas pour les articles, l’on assiste à une impossibilité de vente
dans le cas où l’article est actif.
-
Figure 5 : PCB manquant :
Le PCB signifiant littéralement Par Combien est la variable qui nous désigne le nombre de
représentation d’un article dans son paquet ou son carton.
Lorsque le groupe de variante n’est pas renseigné nous rencontrons un article qui ne descend pas dans
le cadencier.
En effet le cadencier est un système permettant au logiciel de généré des commandes
automatiquement. Des commandes ne seront donc pas générées pour les articles connaissant cette
anomalie.
18
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Pour les articles IMPORT, lorsque ces valeurs n’existent pas, l’on se retrouve dans l’impossibilité de
validation du conteneur livrant ces articles.
- Figure 8 : UL manquant :
Cette anomalie est une anomalie très importante car elle engendre directement une impossibilité de
commander l’article (par commande manuelle ou automatique)
Figure 9 : Code état = 0
Lorsque la variable code état affiche comme modalité 0, cela signifie que la création de l’article n’a
pas été terminée. Autrement dit il y a des informations essentielles qui n’ont pas été renseigné.
Par conséquent l’article est considéré inexistant dans notre base de données.
B. ANOMALIE DE PARAMETRAGES
19
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Lorsqu’un article est actif et non commandable. Les commandables ne peuvent pas être générés sur
lesdits articles et par conséquent on se retrouve avec des problèmes de rupture de stocks
20
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Le code état F désigne les articles en Fin de vie, autrement dit les articles qui sont censés ne plus
être vendu chez l’entreprise. Ainsi le code état F s’assure d’épuiser le stock déjà présent avant de
passer l’article en code état Bloqué (B). Les articles ne doivent donc pas être commandable.
21
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Source : L’étudiant
I. Contexte
L’une des principales taches du Services Base de données de CFAO RETAIL CI est la
correction des anomalies rencontrées sur les articles référencés dans la base de données
PAYS. Toutefois la detection des ses anomalies s’avèrent quelques peu très chronophage vu
les autres exigences auxquelles le service est appelé, le service arrive quand même à détecter
certaines anomalies et les corrige aux mieux de ce qu’ils peuvent. Ainsi on assiste à une
variation du nombre d’anomalie d’un jour à l’autre. Cette variable qu’est le nombre
d’anomalie journalier peut donc être étudié. C’est donc dans cette optique que nous avons
décidé de l’utiliser afin d’en faire une étude comparative entre la période avant la mise en
place de notre solution et la période après la mise en place de notre solution en vue d’évaluer
la performances et l’impact de notre solution
Pour obtenir les données sur notre variable d’intérêt qui est le nombre d’anomalie par jour,
nous avons procéder comme suit:
22
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Ainsi nous avons obtenu les différents nombre journalier d’anomalie sur les deux différentes
périodes. Les tableaux ci dessous recapitule aisément:
AVANT APRES
Date Missing Error Date Missing Error
02/10/2022 1814 1199 02/11/2022 1803 1318
03/10/2022 1824 1092 03/11/2022 1780 1317
04/10/2022 1799 1577 04/11/2022 1717 1332
05/10/2022 1810 1568 05/11/2022 1733 1357
06/10/2022 1787 1119 06/11/2022 1744 1331
07/10/2022 1788 1052 07/11/2022 1697 1271
08/10/2022 1793 1384 08/11/2022 1720 1341
09/10/2022 1792 1314 09/11/2022 1710 1421
10/10/2022 1799 1316 10/11/2022 1583 1279
11/10/2022 1781 1746 11/11/2022 1423 1274
12/10/2022 1799 1777 12/11/2022 1263 1269
13/10/2022 1780 1678 13/11/2022 1103 1263
14/10/2022 1804 1553 14/11/2022 1249 1269
15/10/2022 1780 1678 15/11/2022 1199 1329
16/10/2022 1793 1167 16/11/2022 1219 1254
17/10/2022 1768 1533 17/11/2022 1199 1000
18/10/2022 1766 1507 18/11/2022 1179 852
19/10/2022 1744 878 19/11/2022 1154 952
20/10/2022 1757 1668 20/11/2022 1156 972
21/10/2022 1754 1597 21/11/2022 1138 952
22/10/2022 1734 1050 22/11/2022 1156 938
23/10/2022 1753 900 23/11/2022 1131 950
24/10/2022 1778 892 24/11/2022 1095 940
25/10/2022 1796 1592 25/11/2022 1090 951
26/10/2022 1776 1009 26/11/2022 1084 967
27/10/2022 1762 1304 27/11/2022 1076 979
28/10/2022 1785 1394 28/11/2022 1068 966
29/10/2022 1796 946 29/11/2022 1060 956
30/10/2022 1813 1799 30/11/2022 1051 946
31/10/2022 1833 1318 01/12/2022 1046 927
23
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
NB:
- Missing : Variable dont la modalité est le nombre d’anomalie par jour de type Valeur
manquante
- Error : Variable dont la modalité est le nombre d’anomalie par jour de type Erreur de
paramétrage
Tableau 4 et Tableau 5 : Echantillon de données collecter sur 30 jour pour chaque type
d’anomalies
Ainsi nous avons les tendances suivantes en ce qui concerne le nombre d’anomalie
journaliers de valeur manquante et d’erreur de paramétrage avant la solution sur 30 jours :
Missing1 Error1
24
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Notons aussi que les anomalies ne cessent de se créer pendant ces jours-là.
2000
1800
1600
1400
1200
1000
800
600
400
200
0
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 2 2
/ 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20 / 20
/ 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 / 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 1/ 1 2
Missing2 Error2
IV.
25
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Le test que nous allons réaliser aura pour but de confirmer ou infirmer l’hypothèse suivante :
La mise en utilisation de la solution a-t-il eu un impact sur le nombre journalier d’anomalie ?
Si oui, quel est le sens de cet impact ?
Pour ce faire nous réaliserons un test de comparaison de deux moyenne basé sur des
échantillons non appariés.
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
MISE Ha:
EN PLACE
ratioD’UNE
< 1 SOLUTION DE DETECTION AUTOMATIQUE
Ha: ratio != 1 DES ANOMALIESHa:
DESratio
DONNEES
> 1
Pr(F < f) = 0.0000 REFERENTIELLES
2*Pr(F < DE
f) CFAO RETAIL
= 0.0000 Pr(F > f) = 1.0000
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
27
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
28
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
29
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
30
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
Cette mini application de détection des anomalies a été conçu en vue de faciliter l’utilisation
par tous.
Elle est dotée d’une table appelé « article » qui est alimentée par un fichier Excel appelé
« TEST » et de deux formulaire de filtre automatisé par des codes VBA appelés Selection_Sql
et Selection_Sql2 respectivement pour les anomalies de valeurs manquantes et les anomalies
de paramétrages.
Ainsi :
31
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
- Etape 5 : Dans le sous formulaire juste en dessous, les anomalies rencontrées seront
présentées, copier et coller ces données dans un lieu pour leurs traitement (de
préférence dans une feuille Excel).
Pour la détection des erreurs de paramétrages
- Etape 4 : Ouvrir le formulaire « Selection_SQL » et cliquez sur l’un des boutons
‘valider’ selon les anomalies que vous souhaitez avoir
- Etape 5 : Dans le sous formulaire juste en dessous, les anomalies rencontrées seront
présentées, copier et coller ces données dans un lieu pour leurs traitement (de
préférence dans une feuille Excel).
Les filtres automatiques qui nous permettent de détecter les anomalies sont contrôlés par des
requêtes SQL filtrant la table « articles »
Select* From article Where Prixtarif is null or Prix5 is null or Prixventecodé1 is null or Prixventecodé2
is null or Prixventecodé3 is null or Prixventecodé4 is null
Select * FROM article where Codeétat = F and nom is not null and princ# = O
32
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
PERFORMANCE DE LA SOLUTION.
- Après la mise en œuvre de la solution, nous constatons une tendance général baissière
pour les deux variables. Ainsi nous pouvons émettre l’hypothèse selon laquelle, la
mise en œuvre de la solution a eu un impact sur le nombre journalier d’anomalie.
Toutefois nous remarquons une linéarité forte entre les deux variables, comme
L’indique le tableau de corrélation ci-dessous :
Tableau 6 : Tableau de corrélation entre la variable MISSING2 (Missing après la solution) et
ERROR2 (Error apres la solution)
MISSING2 ERROR2
MISSING2 1.0000
ERROR2 0.8083 1.0000
Ou le coefficient de corrélation est égale 0.8. Nous pouvons donc dire que la baisse des deux
types d’anomalie a évolué dans le même sens, cela traduit le fait que les deux anomalies ont
commencé à être considéré aux même titre vu que la solution les détecter tous deux.
33
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
L’objet de ce test d’égalité entre les moyenne des deux échantillons avait pour but de savoir si
l’apport de la solution a eu un impact significatif sur le nombre des anomalies.
Le dernier test lui nous présente le résultat du test d’égalité des moyennes des variables
MISSING 1 et MISSING 2 ainsi que ERROR1 et ERROR2. Le test a été réalisé sur la base
d’échantillon non apparié de variances différentes. Avec pour hypothèse nulle les moyennes
des variables MISSING 1 et MISSING 2 sont égales et les moyennes des variables ERROR1
et ERROR2 sont aussi égales.
La conclusion était donc que les moyennes des différentes variables étaient différentes car
l’hypothèse nulle fut rejetée pour les deux types d’anomalies des deux périodes.
De plus, l’hypothèse nulle selon laquelle les différences moyenne (MISSING 1 - MISSING 2)
ainsi que moyenne (ERROR1 - ERROR2) sont inferieur s’avère être non rejetable car donnant
des P-value = 1.000>0.05 pour les valeurs manquantes et P-value = 0.996 > 0.05 pour les
Erreur de paramétrages.
On conclut donc que les moyennes des variables MISSING 2 et ERROR2 sont inferieur a
celles des variables ERROR1 et ERROR2 respectivement.
Par conséquent la solution de détection des anomalies dans la base de données a eu un impact
positif significatif a 95% sur le nombre journalier des anomalies que ce soit pour les
anomalies de valeurs manquante que pour les anomalie d’erreur de paramétrage sur les
échantillons de 30 jours que nous avons prélevés.
Nous pouvons donc dire que notre solution est fiable.
34
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
CONCLUSION GENERALE
CFAO RETAIL, ayant la volonté de se hisser au rang des leaders du secteur de la grande
distribution en Afrique, doit également orienter ses politiques sur la qualité des données sur
35
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
lesquelles elle se base pour prendre ses décisions ainsi que les données dont elle se sert pour
son fonctionnement. Car en effet, les données qu’utilisent l’entreprise dans son
fonctionnement sont entachées d’anomalie ce qui engendre des pertes direct et indirect pour
l’entreprise et fausse ces décisions pour sa veille économique. C’est pour palier à ce problème
que nous avons travaillé sur ce sujet.
Ainsi nous avons mis en place une solution office développée sur Microsoft accès pour la
détection automatique des anomalies dans la base de données des articles de l’entreprise. Et
démontrer sur la base d’échantillons une étude comparative montrant les performances de
cette solution sur les anomalies de la base de données.
Il est à noter que les anomalies présentent dans la base de données des articles de l’entreprise
ont une cause et après observation ainsi que par des entretien semi-directs, nous remarquons
que :
- Les anomalies sont présentes car les données transmises au services BASE DE DONNEES
sont au préalable erronées
- Les anomalies sont présentes car il y a très souvent un problème de transmission des
informations entre le système de gestion et la base de données elle-même.
- Les anomalies sont présentes car les agents de la base de données commettent des erreurs et
ce beaucoup plus lors du référencement des articles
- Les anomalies sont présentes souvent à cause d’un dysfonctionnement du progiciel de
gestion.
Bibliographies
Ouvrages :
36
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
WEBOGRAPHIE
- Https://www.sql.sh/cours/select
- https://www.cfaogroup.com/wp-content/uploads/2021/10/cfao-profil-
2021.pdf
- https://www.larousse.fr/dictionnaires/francais
- https://support.microsoft.com/fr-fr/microsoft-365
- https://www.youtube.com/watch?v=VL4L5_JexNo30
DEDICACE…………………………………………………………………………………...I
37
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
REMERCIEMENTS………………………………………………………………………….II
SOMMAIRE………………………………………………………………………………….III
LISTE DES SIGLES ET ABREVIATIONS………………………………………………....IV
LISTE DES FIGURES………………………………………………………… ………….....V
LISTES DES TABLEAUX………………………………………………………………......VI
AVANT-PROPOS…………………………………………………………………………...VII
INTRODUCTION GENERALE……………………………………………………………...1
PARTIE I : CADRE D’ETUDE…………………………………………………………........3
CHAPITRE 1 : ENVIRONNEMENT D’ETUDE………………………………………….....3
III. CFAO GROUP…………………………………….…...………………………………....3
1. PRESENTATION…………………………………………………………………………..3
2. HISTORIQUE ET EVOLUTION …………………….......................................................4
3. DOMAINE D’ACTIVITES………………………………………………………………..4
IV. CFAO RETAIL……………………………………………………………………...…....5
1. PRESENTATION………………………………………………………………………….5
2. HISTORIQUE ET EVOLUTION………………………………………………………….5
IV. CFAO RETAIL CI…………………………………………………………………….….6
1. L’ORGANISATION SYSTEME ET SUPPLY CHAIN SDA…………………….….6
2. PRESENTATION ET ORGANISATION……........................ ….........................................7
3. FONCTIONNEMENT………………………………………………………………...........7
4. BASE DE DONNEES ET REFERENTIEL…………………………………………...........7
A. BASE DE DONNEES……………………………………………………………...............8
B. REFERENTIEL…………………………………………………………………….............8
CHAPITRE 2 : CADRE THEORIQUE…………………………………………………….....9
II. REVUE DE LITTERATURE……………………………………………………………..10
1. REVUE THEORIQUE DU SUJET………………...…… ………………………….........11
2. REVUE EMPIRIQUE DU SUJET………………………................................................12
3. JUSTIFICATION ET INTERET DE L’ETUDE ………...................................................13
CONCLUSION PARTIELLE…………………………………………………………….....14
PARTIE 2 : APPROCHE METHODOLOGIQUE ET RESULTATS DE L’ETUDE ……...14
38
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
ANNEXES
39
MISE EN PLACE D’UNE SOLUTION DE DETECTION AUTOMATIQUE DES ANOMALIES DES DONNEES
REFERENTIELLES DE CFAO RETAIL
40