Académique Documents
Professionnel Documents
Culture Documents
Université De Jendouba.
La Faculté des Sciences Juridiques, Economiques et de Gestion
de Jendouba.
Au sein de : ASTEELFLASH
Avant tous nous remercions le bon Dieu de nous avoir aidé à réaliser ce
modeste travail de projet de fin d’études
Je remercie Mme.Rym Almiya, mon encadrante professionnelle , pour m’avoir
accepté dans son honorable établissement, et de m’avoir donné l’opportunité,
à travers mon stage.
Je tiens à remercier également mon encadrante académique Dr. Neila Rjaibi
pour son encadrement de qualité, sa motivation professionnelle, son encou-
ragement, ses conseils et critiques constructives, sa gentillesse et sa patience
ainsi pour le temps qu’elle a consacré à la réalisation de ce travail
je remercie les membres du Jury d’avoir accepté d’évaluer ce modeste travail
en espérant qu’ils trouvent dans ce rapport les qualités de clarté et de
motivations qu’ils attendent.
Finalement, je remercie ma famille et mes amis qui m’ont toujours soutenue
dans mon cursus universitaire que dans mes choix personnels.
ii
Table des matières
Remerciements ii
1 Context Générale 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Historique Business Intelligence (BI) . . . . . . . . . . . . . . . 1
1.3 Présentation de ASTEELFLASH . . . . . . . . . . . . . . . . . 2
1.4 Etude de l’existant . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Critique de l’existant . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6 Solution proposée . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Diagramme de Gantt . . . . . . . . . . . . . . . . . . . . . . . . 6
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Data warehouse(DW) 8
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 l’importation de DW . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 SharePoint . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Le JavaScript Object Notation (JSON) . . . . . . . . . . 10
2.2.3 Chargement les bases des données dans power BI . . . . 10
2.2.4 Présentation des Tables . . . . . . . . . . . . . . . . . . 13
2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
iii
3 Implémentation de la solution BI 28
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Les outils de développement . . . . . . . . . . . . . . . . . . . . 29
3.2.1 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 Microsoft Power BI . . . . . . . . . . . . . . . . . . . . . 30
3.2.3 Pandas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.4 Matplotlib . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Analyse des données . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Dax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Tableaux de bord . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4 Intégration code python dans power BI . . . . . . . . . . . . . . 38
3.5 Analyse ResSource Humaine (RH) . . . . . . . . . . . . . . . . . 38
3.5.1 Ressource Humain . . . . . . . . . . . . . . . . . . . . . 38
3.5.2 Tableaux de bord R.H . . . . . . . . . . . . . . . . . . . 39
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4 Analyse Prédictive 42
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Préparation des données . . . . . . . . . . . . . . . . . . . . . . 43
4.3 Les technologies . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3.1 Colaboratory . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3.2 Bibliothèque . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Prédiction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4.1 Régression linéaire . . . . . . . . . . . . . . . . . . . . . 45
4.4.2 L’arbre de décision . . . . . . . . . . . . . . . . . . . . . 46
4.4.3 Matrice de corrélation . . . . . . . . . . . . . . . . . . . 47
4.4.4 Les interface de prediction . . . . . . . . . . . . . . . . . 48
4.5 Prise de décision . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Liste des figures
v
3.3 Logo Pandas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4 Logo Matplotlib . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Logo DAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.6 Requêtes DAX . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.7 Page Home . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.8 Page Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.9 Page Water Intesnity . . . . . . . . . . . . . . . . . . . . . . . . 34
3.10 Page energie Intesnity . . . . . . . . . . . . . . . . . . . . . . . 35
3.11 Page hazardouse waste Intesnity . . . . . . . . . . . . . . . . . 35
3.12 comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.13 Page HEALTH SAFETY . . . . . . . . . . . . . . . . . . . . . 37
3.14 Code python . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.15 les performance des indicateurs . . . . . . . . . . . . . . . . . . 39
3.16 les performance des indicateurs 2022 en mois . . . . . . . . . . 40
Les entreprises peuvent adopter différentes approches pour gérer leur impact
environnemental dans le cadre de leur RSE. Cela peut inclure des initiatives
telles que l’utilisation d’énergies renouvelables, la réduction des déchets, l’effi-
cacité énergétique, la durabilité des produits et la préservation des ressources
naturelles, réduire les émissions de gaz à effet de serre et aussi gérer les aspects
de santé et de sécurité de leur RSE. Cela peut inclure des initiatives telles que
la mise en place de programmes de sécurité pour les employés, la formation sur
les risques pour la santé, la vérification de la conformité aux réglementations
en matière de santé et de sécurité, et la surveillance des conditions de travail
pour assurer la sécurité des employés.
1
Introduction générale 2
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . 7
3
Context Générale 1
1.1 Introduction
Dans les années 1950 et 1960, les entreprises ont commencé à utiliser des sys-
tèmes informatiques pour stocker et traiter des données. Cependant, ces sys-
tèmes étaient souvent limités et ne permettaient pas d’analyser efficacement
les données. Dans les années 1970, les premiers outils de BI ont été développés
pour aider les entreprises à extraire et à analyser des données à partir de leurs
systèmes informatiques. Cependant, ces outils étaient encore assez rudimen-
taires et coûteux. Dans les années 1980, les bases de données relationnelles ont
été introduites, ce qui a permis de stocker et de gérer des données de manière
plus efficace. Les outils de BI ont également commencé à se développer pour
tirer parti de ces nouvelles technologies. Dans les années 1990, les outils de
BI ont commencé à devenir plus conviviaux et plus accessibles, ce qui a per-
mis à un plus grand nombre de personnes dans l’entreprise de les utiliser. Les
tableaux de bord, qui fournissent une vue d’ensemble des indicateurs clés de
performance (KPI), ont également commencé à être largement utilisés. Dans
les années 2000, la croissance explosive de l’Internet a créé de nouvelles sources
de données et de nouveaux défis pour la BI. Les outils de BI ont commencé à
intégrer des fonctionnalités d’analyse de données en temps réel, de visualisa-
tion de données et de collaboration.
Aujourd’hui, les outils de BI ont évolué pour devenir des plates-formes com-
plètes qui intègrent des fonctionnalités d’analyse prédictive, d’intelligence ar-
tificielle (IA), d’apprentissage automatique (ML) et de traitement du langage
naturel (NLP). Les entreprises utilisent la BI pour prendre des décisions plus
éclairées, optimiser leurs opérations, améliorer leur efficacité et leur rentabilité,
Context Générale 2
1.5.1 Problématique
Dans notre entreprise les données sont stockées sans analyse. Ce qui est en
gendre des problèmes comme :
réduit à son tour votre capacité de stockage sans ajouter de valeur sup-
plémentaire. Pour résoudre ce problème, les organisations doivent déve-
lopper une source unique de vérité pour les données, ce qui est souvent la
valeur de la création de pipelines de données qui alimentent les entrepôts
de données.
• Stockage des données : Vous devez stocker les données dans une base de
données, qui peut être une base de données relationnelle, un entrepôt de
données ou une base de données No SQL, en fonction de vos besoins.
• Calucul : utilisation des fonctions DAX pour calculer des valeurs bien
déterminer
• Analyse des données : Ensuite, nous pouvons utiliser des outils de BI tels
que des tableaux de bord, des rapports, des visualisations de données
pour analyser les données collectées.
1.8 Conclusion
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . 9
2.2 l’importation de DW . . . . . . . . . . . . . . . . . 9
2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . 27
8
Data warehouse 9
2.1 Introduction
La gestion efficace des données est devenue une priorité majeure pour les
organisations modernes. Les entreprises collectent une quantité considérable
de données provenant de diverses sources telles que les ventes, les opérations,
les finances et le marketing. Cependant, pour tirer pleinement parti de ces
données et en extraire des informations précieuses, il est essentiel de disposer
d’un système de gestion des données robuste et organisé.
2.2 l’importation de DW
2.2.1 SharePoint
Nous avons exporté les bases de tous les entreprises de format Excel puis je les
Data warehouse 10
Une base de données JSON est une base de données No SQL de type docu-
ment, idéale pour stocker des données semi-structurées. Il est beaucoup plus
flexible que le format lignes-colonnes, qui est fixe et coûteux lorsqu’il s’agit
d’implémenter même de petites modifications de schéma.
Dans une base de données bien conçue, chaque table stocke les données d’un
sujet spécifique, tel que les employés ou les produits. Une table contient des
enregistrements (lignes) et des champs (colonnes). Les champs ont des types
de données différents, tels que du texte, des nombres, des dates etc... Nous
allons présenter tous les tables de notre base des données.
« SUZ » est une entreprise en Chine est une de groupe Asteelflash Table «
SUZ » est une table contient les champs suivant :
Année : qui représente l’années de l’action de entreprise
Mois : qui représente chaque mois de l’action de entreprise
Site : qui représente le nom de l’entreprise de entreprise
Major : EHS défets qui représente les actions dangereuses dans l’entreprise de
entreprise
EHS fines : qui représente les amandes de entreprise
Revenue : représente le revenu de entreprise
Water cons : la consommation d’eau de l’entreprise
Water intensity : la consommation d’eau par rapport le revenu de entreprise
Hazardouse waste (kg) : les déchets dangereux de entreprise en kg
Hazardouse waste intensité :les dechets par rapport le revenu de entreprise
Power cons : consommation d’énergie de entreprise
Power intensity : consommation d’energie de entreprise
Accidents : le nombre d’accidents dansl’entreprise
Data warehouse 27
2.4 Conclusion
Dans ce chapitre nous avons commencé par une présentation des concepts
de DW et la présentation des tables warehouse et ses différents composants.
Chaque nom de table représente le nom de chaque entreprise.
3
Implémentation de la solution BI
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . 29
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . 41
28
Implémentation de la solution BI 29
3.1 Introduction
Dans ce chapitre nous allons mettre en valeur les 3 phases de ce projet qui sont
dans l’ordre suivant : Compréhension et analyse des données, Elaboration des
tableaux de bord
Dans cette section, nous allons explorer les différentes technologies et biblio-
thèques de Python que nous allons utiliser pour atteindre les objectifs de ce
projet.
3.2.1 PYTHON
3.2.3 Pandas
3.2.4 Matplotlib
3.2.1 Dax
une ou plusieurs valeurs. DAX vous aide à créer des informations à partir des
données déjà présentes dans votre modèle
Dans notre projet nous avons utilisées des requêtes DAX pour calculer la
consommation d’eau et la consommation d’énergie et le recyclage des déchets
par rapport la revenue de chaque entreprise.
Durant cette partie, nous allons élaborer les tableaux de bord. Il s’agit d’un re-
porting pour le suivi des indicateurs demandés par la société selon l’agrégation
visée par plusieurs filtres (home, Overview, water intensity, énergie intensity,
hazardous wast intensity, Health safety) et la comparaison entre les années de
chaque entreprise.
Dans cette interface dans figure 3.7 nous avons présentés la région, le pays et la
localisation de chaque entreprise dans le monde. Cette interface est interactive
avec une carte géographique bien localiser avec longitude et latitude.
Dans cette interface dans figure 3.8 nous avons analysés total water intensity,
total energy intensity, total waste recycling et waste recycling distribution de
tous les entreprises selon les années. L’indice d’intensité en eau est une mesure
qui permet d’évaluer la consommation d’eau d’une entreprise. Plus l’indice est
élevé, plus la consommation d’eau est importante. Dans ce cas, « ATL » a
le niveau le plus élevé, ce qui suggère qu’elle utilise une quantité considérable
d’eau dans ses opérations.
Et aussi « PLZ » qui a une le recyclage des déchets 100 pourcent et 20 pourcent
par rapport d’autres usines
Dans cette interface dans figure 3.9 nous avons analysés water intensity de
chaque entreprise selon les mois. Une augmentation de l’intensité d’eau dans
l’entreprise « ATL » mars 2021 et mars 2022 peut être le résultat d’une crois-
sance des activités, d’une utilisation inefficace de l’eau ou de changements
externes. Il est crucial pour l’entreprise de prendre des mesures pour réduire
cette intensité, en adoptant des pratiques plus durables et en favorisant une
utilisation efficace de l’eau dans ses opérations.
Implémentation de la solution BI 35
Dans cette interface dans figure 3.10 nous avons analysés energy intensity de
chaque entreprise selon les mois. L’intensité d’énergie a augmenté janvier 2021
et janvier 2022, cela pourrait indiquer une augmentation de la consommation
d’énergie de l’entreprise « ATL » ou du secteur concerné. Une telle augmenta-
tion peut être due à plusieurs facteurs, notamment la croissance de l’activité
économique, l’expansion de l’entreprise, l’ajout de nouvelles installations ou
l’utilisation accrue de machines et d’équipements énergivores.
Dans cette interface dans figure 3.11 nous avons analysés Hazardous Waste
intensity de chaque entreprise selon les mois.
Dans cette interface dans figure 3.12 nous avons analysés les accidents et les in-
juries de chaque entreprise selon les années. Le nombre d’injuries (blessures) et
d’accidents au sein d’une entreprise est un indicateur important de la sécurité
et du bien-être des employés. Les injures et les accidents peuvent entraîner des
conséquences graves pour les travailleurs et avoir un impact sur la productivité
et les opérations de l’entreprise. En comparant les données de l’entreprise «
SKR » de 2021 et 2022, on observe une légère diminution du nombre d’inju-
ries, passant de 5 à 4, ce qui suggère une amélioration dans la prévention des
blessures au sein de l’entreprise. Cependant, il est important de continuer à
maintenir et à améliorer les efforts en matière de sécurité pour réduire davan-
tage le nombre de blessures. En revanche, le nombre d’accidents a augmenté
de 2 en 2021 à 6 en 2022. Cette augmentation est préoccupante et nécessite
une analyse approfondie pour comprendre les raisons de cette hausse. Cela
pourrait indiquer des lacunes dans les procédures de sécurité, le respect des
réglementations ou la formation des employés. Bien que le nombre d’injuries
ait légèrement diminué, l’augmentation des accidents en 2022 est une préoc-
cupation majeure. L’entreprise doit poursuivre ses efforts pour prévenir les
blessures et les accidents en renforçant les mesures de sécurité, en améliorant
la formation et en promouvant une culture de sécurité. Une analyse plus ap-
Implémentation de la solution BI 38
profondie des incidents peut aider à identifier les causes et à mettre en place
des mesures préventives adéquates pour garantir un environnement de travail
sûr pour tous les employés.
Dans cette figure 3.13 un script python pour histogramme avec l’éditeur de
Power BI
Dans cette section, nous avons analysé les performances des indicateurs pour
l’année 2021 et l’année 2022. Nous avons constaté que les indicateurs suivants :
"turnover" (taux de rotation du personnel), "taux de réalisation des formations
planifiées", "taux d’absentéisme", "heures de formation"
On observe que tous les indicateures atteint leurs objectifs sauf "coût de la
formation".
Implémentation de la solution BI 40
Dans cette figure qui représente un tableau de bord pour les indicateurs en
mois on observe : Turnover (taux de rotation du personnel) : Le fait que le
taux de rotation du personnel ait atteint l’objectif fixé indique que l’entre-
prise a réussi à maintenir un niveau stable de fidélité de ses employés. Cela
peut être le résultat d’une gestion efficace des ressources humaines, d’une sa-
tisfaction élevée des employés ou d’autres mesures mises en place pour réduire
le turnover. Taux de réalisation : L’atteinte de l’objectif de janvier jusqu’à
juillet pour le taux de réalisation des formations planifiées suggère que l’en-
treprise a réussi à mettre en œuvre efficacement son programme de formation.
Cela témoigne d’une gestion proactive du développement des compétences des
employés et de l’investissement dans leur formation continue. Taux d’absen-
téisme : Le fait que le taux d’absentéisme ait atteint l’objectif fixé indique
une bonne gestion des absences au sein de l’entreprise. Cela peut être le ré-
sultat de politiques de congés équilibrées, d’un environnement de travail sain
et d’une communication transparente avec les employés. Heures de formation :
L’atteinte de l’objectif pour les heures de formation suggère que l’entreprise
a réussi à consacrer suffisamment de temps aux activités de formation de ses
employés. Cela démontre un engagement envers le développement des compé-
Implémentation de la solution BI 41
3.5 Conclusion
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . 43
4.4 Prédiction . . . . . . . . . . . . . . . . . . . . . . . 45
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . 55
42
Analyse Prédictive 43
4.1 Introduction
4.3.1 Colaboratory
4.3.2 Bibliothèque
4.4 Prédiction
Dans cette partie nous allons analyser les données avec deux modelés de pré-
diction comme ‘régression linéaire ’, l’arbre de décision ’.
Une matrice de corrélation est un tableau qui affiche la corrélation entre les
variables. Et enfin nous avons choisir la matrice de corrélation pour la classi-
fication
Analyse Prédictive 48
Dans cette partie nous allons voir le résultat de la prédiction de chaque entre-
prise et nous allons l’interpréter .
Analyse Prédictive 49
Nous avons remarqué dans cette figure 4.8 qu’il Ya une régression linéaire
moyenne avec une faible corrélation de précision 25%.
Nous avons remarqué dans cette figure 4.9 qu’il Ya une régression linéaire
moyenne aussi avec une moyenne corrélation de précision 44%.
Nous avons remarqué dans cette figure 4.10 qu’il Ya une régression linéaire
faible avec une faible corrélation de précision 9%
Nous avons remarqué dans cette figure 4.11 qu’il Ya une bonne régression
linéaire avec une forte corrélation de précision 90%
Nous avons remarqué dans cette figure 4.11 qu’il Ya une bonne régression
linéaire avec une forte corrélation de précision 75
Nous avons remarqué dans cette figure 4.12 qu’il Ya une mauvaise régression
linéaire avec une faible corrélation de précision 13
Nous avons remarqué dans cette figure 4.13 qu’il Ya une moyenne régression
linéaire avec une bonne corrélation de précision 44%.
Nous avons remarqué dans cette figure 4.14 qu’il Ya une très bonne régression
linéaire avec une forte corrélation de précision 99%
Nous avons remarqué dans cette figure 4.15 qu’il Ya une mauvaise régression
linéaire, faible corrélation de précision 2%.
Nous avons remarqué dans cette figure 4.16 qu’il Ya une bonne régression
linéaire, moyenne corrélation de précision 49%.
Dans cette figure 4.16 qu’il Ya une mauvaise régression linéaires mauvaise
corrélation de précision 9%.
4.6 Conclusion
Nous avons élaboré des tableaux de bords riches et interactifs suivant le besoin
de la société et aussi nous avons effectué une analyse prédictive. Pour atteindre
les objectifs fixés dès le départ, nous avons d’abord commencé par une étude
des besoins et des outils nécessaires avec une compréhension des données.
Puis j’ai élaboré les fichier JSON, et j’ai utilisé python pour les préparer les
données pour l’implémenter dans notre modèle de Machine Learning. Non
seulement j’ai réussi à capitaliser de bonnes connaissances sur l’analyse pré-
dictive avec Python et l’élaboration des tableaux de bord avec Power BI, mais
aussi j’ai développé mes capacités d’adaptation, de communication et de tra-
vail en équipe.
En plus, ce stage m’a donné une grande motivation pour mieux développer
mes compétences en BI vu l’intérêt qu’occupe ce domaine dans les entreprises
actuellement à travers l’aide à la décision principalement.
56
Bibliographie
[1] :https ://www.salesforce.com/fr/blog/2016/06/une-breve-histoire-de-la-business-
intelligence.html
[2] : https ://support.microsoft.com/fr-fr/office/
[3] :https ://www.journaldunet.fr/web-tech/dictionnaire-du-webmastering/1445308-
json-definition-et-presentation-de-ce-format-de-donnees/
[4] : ournaldunet.fr/web-tech/dictionnaire-du-webmastering/1445304-python-
definition-et-utilisation-de-ce-langage-informatique/
[5] : https ://powerbi.microsoft.com/fr-fr/what-is-power-bi/
[6] : https ://www.activestate.com/resources/quick-reads/what-is-pandas-in-
python-everything-you-need-to-know/
[7] : https ://www.techopedia.com/definition/33861/matplotlib
[8] : https ://learn.microsoft.com/fr-fr/power-bi/transform-model/desktop-quickstart-
learn-dax-basics
[9] : https ://research.google.com/colaboratory/faq.html ?
[10] : https ://seaborn.pydata.org/
[11] :https ://www.data-transitionnumerique.com/scikit-learn-python/
[12] :https ://aws.amazon.com/fr/what-is/linear-regression/
[13] :https ://www.lucidchart.com/pages/fr/arbre-de-decision
[14] :https ://www.zucisystems.com/be/blog/quest-ce-quune-matrice-de-correlation-
comment-lutiliser-pour-prendre-des-decisions-commerciales/
57