Vous êtes sur la page 1sur 19

SCIENCES DES DONNÉES APPLIQUÉES (fONDAMENTALES)

• Année : 2022/2023
Responsable Module Mr. Khalid El Fayq • Session : 8 – Hiver 2022
ère • Volume horaire 64
Niveau 4 Année
• Crédits : 4
Filière Génie informatique

1
Bibliographie
Support obligatoire :
Titre auteur Edition Année Nature
Fluent Python: Clear, Concise, and Disponible dans la bibliothèque
Luciano Ramalho O`Reilley 2015
Effective Programming. virtuelle
Python Data Science Disponible
Jake VanderPlas O`Reilley 2016
Handbook dans la BV

2
1-Introduction to Data Science
• La data science ou la science des données est un concept qui allie data inférence et développement d’algorithmes et de technologies.

• La science de données est une discipline qui permet de résoudre des problèmes analytiques complexes au sein d’une organisation.

• Cela concerne les masses de données stockées dans les bases de données des entreprises. Cette analyse de données est exploitée
par les entreprises afin de leur générer une valeur ajoutée.

• La data science permet de faire une exploration et une analyse de données brutes au sein d’une entreprise. Ce concept analytics est
essentiel pour prédire et anticiper les problèmes pouvant survenir. Quels sont les objectifs de la science des données ? En quoi
consiste le métier d’un data scientist ? Pourquoi un scientifique en science des données est de grande valeur pour une entreprise ?

3
2-Objectifs et résultats attendus de la science des données

• La data science permet d’une part de faire une découverte d’insights dans les données et d’assurer la création d’un Data Product.

• L’analyse approfondie de ces informations sur un plan granulaire, va permettre aux utilisateurs de comprendre et de mieux cerner les
tendances et les comportements. L’analyse de la variation des tendances sera d’une aide précieuse dans le processus de prise de
décision.

• La création de Data Product se fait par l’intermédiaire d’algorithmes divers. Il peut s’agir par exemple d’un moteur de
recommandation, se basant sur les données de chaque utilisateur. Les utilisateurs bénéficieront alors d’une recommandation
personnalisée suivant leurs besoins.

4
3-Le métier de scientifique spécialisé en science de données

• Le professionnel qualifié en science de données est appelé « data scientist ». C’est un métier à part entière qui
requiert une grande expertise en mathématiques, en développement technologique et en business intelligence,

Les rôles et responsabilités des data scientists


• Un data scientist ou un data analyst est un professionnel qui se charge des croisements de données d’une entreprise
spécifique avec les données web.
Ce croisement de données va jouer un rôle important dans les prises de décisions stratégiques et opérationnelles au sein
de l’organisation.
Il ne s’agit pas seulement d’un statisticien, le spécialiste en science de données assure :

ü Une proposition de recommandations sur les données à modifier, externaliser ou internaliser ;


ü Une conception des datawarehouse ;
ü Une évaluation des données ;
ü Un traitement et une restitution au niveau du système ciblé.

5
3-Le métier de scientifique spécialisé en science de données
Les carrières les plus courantes en science des données
Les carrières les plus courantes dans le secteur de la data science sont les suivantes :

q Le data scientist ;
q Le chief data officer ;
q L’architecte big data ;
q Le Master data Manager ;
q Le Data miner ;
q Le Data analyst.

Il s’agit d’un métier très recherché dans le monde de la digitalisation, assurant une bonne perspective de carrière.

Les compétences essentielles en science de données

Pour exercer une profession d’analyste de données, il est primordial d’avoir certaines compétences avancées en
mathématiques. Si les statistiques sont importantes, les algorithmes de machine-learning sont basés sur de l’algèbre
linéaire, nécessitant une connaissance en maths.
Un bon data scientist devra également disposer d’une excellente compétence en créativité technologique, pour coder et
créer des prototypes pouvant intégrer des données complexes.
6
4-Les façons pour un data scientist d’apporter de la valeur
ajoutée à une entreprise
• Prendre les meilleures décisions
Avec les volumes de données traités qui ne cessent d’augmenter dans les entreprises, un data scientist va assurer les prédictions
nécessaires pour une action décisionnelle.

• Orienter les actions suivant les tendances


L’analyse quantitative en marketing digital va permettre aux managers de mettre en place un plan d’action adapté à l’évolution du marché
et aux tendances du moment. Les stratégies mises en œuvre se focalisent sur les points à fort potentiel, pour un gain de temps énorme et
un excellent retour sur investissement.
• Identifier les opportunités
Avec chaque analyse réalisée, pas moyen de manquer les opportunités qui se présentent. Les outils informatiques seront efficaces et
entièrement adaptés aux besoins.
• Utiliser des éléments quantifiables et fondés pour les prises de décision
Une analyse statistique et stratégique doit toujours être mesurable et quantifiable pour connaitre l’impact réel des plans décisionnels au
sein d’une organisation.
Un analyste des données sera le plus compétent en la matière pour sélectionner les données à analyser sans problème.

• Identifier et affiner le public cible


La visualisation des données va améliorer la connaissance client afin d’améliorer les capacités relationnelles de l’entreprise.
Toutes les données exploitables vont faciliter l’identification et l’affinage des public cibles, pour un développement rapide de l’activité.
7
5-Data Scientist's Toolkit
Python

• https://www.python.org/

• PyTorch
• Matplotlib
• NumPy
• Pandas

8
3. Installation :

Vous pouvez télécharger gratuitement le logiciel Python depuis le site officiel ci-dessous :
https://www.python.org/downloads/

Vous pouvez télécharger gratuitement le logiciel PyCharm depuis le site officiel ci-dessous :

https://www.jetbrains.com/pycharm/

Vous pouvez télécharger gratuitement le logiciel Visual Studio Code depuis le site officiel
ci-dessous :

https://visualstudio.microsoft.com/fr/vs/features/python/

Vous pouvez télécharger gratuitement le logiciel Ananconda depuis le


site officiel ci-dessous :

https://www.anaconda.com/

9
5-Data Scientist's Toolkit

Python

10
5-Data Scientist's Toolkit

• Language Julia. • Orangedatamining - - drag and drop

• Language Scala. • ML : Tensorflow

• SQL (SQL server – Oracle – MySQL) • Framework SAS complet

• Plateforme : APACHE HADOOP • API :

• Plateforme : APACHE Spark on real time • Facebook https://developers.facebook.com/

• Data visualisation : Tableau (free tableau public) • Twitter https://developer.twitter.com/en

• PowerBI DashBoard • Dataset : https://www.worldbank.org/en/home

• Outils ML : KMINE model without coding - drag and drop • Kaggle


11
6-Data scientists daily

12
6-Data scientists daily

13
6-Data scientists daily

14
6-Data scientists daily

15
6-Data scientists daily

16
6-Data scientists daily

17
6-Data scientists daily

18
6-Data scientists daily

19

Vous aimerez peut-être aussi