Académique Documents
Professionnel Documents
Culture Documents
PRÉSENTATION
Vous savez déjà développer en Python et souhaitez l'appliquer à l'analyse des données ? Cette formation vous
propose d'approfondir vos connaissances en découvrant les librairies numériques et machine Learning de
Python, les outils de visualisation des données.
Ce module de formation va vous permettre de travailler sur toutes les étapes d'un cycle analytique comme la
préparation et le nettoyage des données, la visualisation, le Machine Learning et la validation des modèles
PUBLIC
Développeurs en Python, Responsables Infocentre, Développeurs de logiciels, programmeurs, Data analysts,
Data scientists.
Minimum : 4 participants Maximum : 10 participants
PRÉREQUIS
Avoir une maîtrise de la programmation Python et des connaissances de base en statistiques.
Pour tous ces prérequis, vous avez la possibilité d’évaluer votre niveau en ligne
https://www.fctsolutions.com/evaluez-votre-niveau/
OBJECTIFS
1/3
PROGRAMME DE LA FORMATION
JOUR 1
L’analytique
• Le modèle analytique et ses éléments
• Les types de modèles analytiques : Descriptive prédictive, prescriptive
• L’importante de la qualité des données dans la modélisation analytique
• Les limitations des modèles analytiques
• Les librairies Python pour l’analyse des données
• Les librairies Python pour l’analyse du Big Data
JOUR 2
Scikit-learn: Machine learning.
• Introduction à scikit-learn et les modules
• Apprentissage supervisé et non supervisé
• La structure d’un modèle dans scikit-learn
• Création d’un modèle avec random forest et effectuer des prédictions
• Comment évaluer un modèle de régression
• Comment évaluer un modèle de classification
• Comprendre la relation entre biais et variance
• Application de la réduction de dimensionnalité
• Exercice pratique : expérimenter l’impact de la réduction de dimensionnalité et le choix des variables
sur la précision des modèle
Bokeh : Visualisation
• Introduction à Bokeh
• Création d’une figure
• Annotation d’une figure
• Types de figures et plots
• Créations de graphs interactifs
• Exercice pratique : Visualisation de séries temporelles avec Bokeh 2/3
PROGRAMME DE LA FORMATION
Jour 3
Préparation, Nettoyage et feature engineering avec Pandas, Numpy et scikit-learn
• Combiner des jeux de données
• Trier, redimensionner, pivoter
• Filtrer les données manquantes
• Suppression des doublons
• Remplacer des valeurs
• Renommer les axes
• Détecter et filtrer les anomalies
• Sampling
• Supprimer des lignes ou colonnes
• Utiliser les expressions régulières
• Binning
• Transformation logarithmique
• Exponential smoothing
• Normalisation
• Vectorisation
• Création de nouvelles variables
• Étude de cas : Explorer et nettoyer un jeu de données
Présentiel : cette formation peut être suivie en présentiel. Le participant reçoit par courriel une convocation indiquant
les modalités d’accès à la formation. La formation est assurée entièrement par le formateur FCT Solutions sur
le lieu de la formation. Le participant connecté à internet via un ordinateur peut accéder à tous les
exercices grâce à une machine virtuelle déployée par le formateur.
Distanciel : cette formation peut être suivie sur le mode distanciel sur simple demande.
Le participant reçoit par courriel un lien lui permettant de rejoindre la classe virtuelle à partir d’un
terminal connecté à internet et disposant du son et d’une webcam intégrée (ordinateur, tablette).
En temps réel (formation synchrone), il suit la formation affichée au centre de l’écran (support de cours
déroulé par le formateur) peut interagir le formateur, qui répond maîtrise la cadence et diffuse l’apprentissage
tout en contrôlant à tout moment la bonne acquisition.
Le formateur peut diffuser sur son écran des outils pédagogiques complémentaires (tableaux, schémas,
graphiques) au fur et à mesure de la formation.
Le participant est évalué pendant la formation au moyen de QCM corrigés avec le formateur afin de
déterminer les acquis.
Tout au long de la formation, le participant peut interagir avec le formateur et même avec d’autres participants,
toujours avec l’encadrement du formateur.
Le participant connecté à internet via un ordinateur peut accéder à tous les exercices grâce à une 3/3
machine virtuelle déployée par le formateur.