Vous êtes sur la page 1sur 7

Analyse de données :

types, techniques et
méthodes
Différents types d’analyse de données :
 Analyse descriptive: résume un ensemble de données, y compris des mesures et des modelés. Les outils
d'analyse exploratoire approfondirent les données collectées pour identifier les relations entre les ensembles
de données.
 L' analyse inferentielle: prend une petite partie des données et les utilise pour supposer une population plus
nombreuse.
 L' analyse prédictive: utilise des données historiques et en temps réel pour prévoir les tendances futures.
L'analyse causale prend deux variables et détermine s'il existe une relation entre elles et pourquoi.
 L’analyse statistique consiste à utiliser les données du passé pour comprendre le présent, sous forme de
tableaux de bord. Cette pratique regroupe la collecte, l’analyse, la présentation et la modélisation des données.
 L’analyse diagnostique, ou diagnostic analysis, consiste quant à elle à comprendre les causes d’un
événement découvert grâce à l’analyse statistique. Elle permet notamment d’identifier des motifs de
comportement dans les données afin de résoudre des problèmes similaires.
 L’analyse prescriptive consiste quant à elle à combiner toutes les informations obtenues à partir des
précédentes analyses pour déterminer quelles mesures prendre pour résoudre un problème ou prendre une
décision.
 L’analyse de texte permet de découvrir des tendances dans de larges ensembles de données textuelles. On
utilise des outils de Data Mining, permettant de transformer les données brutes en informations stratégiques.
Analyse descriptive (exploratoire)
• Une variable est une propriété ou caractéristique d’un individu
Exemple : Couleur des yeux d’une personne, température, état civil, …
Une collection de variables décrivant à un individu
On dit individu ou enregistrement, point, cas, objet, entité, exemple
d’observation
Types de variables
• Qualitative : les variables représentent des catégories différentes au
lieu des numéros.
Les opérations mathématiques comme la somme et la soustraction
n’ont pas de sens.
Exemples : couleur des yeux, niveau académique, adresse IP
• Quantitative : les variables sont les numéros
Exemple : poids, la température, le nombre d’enfants
Les données

• Le point de départ est d’une table de données:


• Exemple :

Nuage de points
Décrire une variable quantitative
• Plusieurs indicateurs permettent de décrire une variable quantitative :
• Les indicateurs de tendance centrale : moyenne, médiane, mode.
• Les indicateurs de dispersion : étendue, variance, écart type, coefficient de
variation.
• Les indicateurs de forme de la distribution : asymétrie, aplatissement.
• Des représentations graphiques : histogrammes ou boîtes à moustaches, par
exemple, qui permettent une description simple des variables quantitatives.
Techniques et méthodes d'analyse des
données massives
• voici quelques exemples :
• L'analyse de données en temps réel : cette méthode permet d'analyser les données en temps réel
à mesure qu'elles sont générées, afin de détecter des tendances ou des anomalies en temps réel.
• L'apprentissage automatique : cette technique permet aux ordinateurs d'apprendre à partir des
données massives en utilisant des algorithmes d'apprentissage automatique, afin de détecter des
modèles et des tendances.
• La fouille de données : cette méthode consiste à extraire des informations utiles à partir de
grandes quantités de données, en utilisant des techniques statistiques et informatiques.
• La visualisation des données : cette technique permet de visualiser les données massives de
manière graphique, afin de faciliter la compréhension et l'analyse.
• Le traitement du langage naturel : cette méthode permet de traiter et d'analyser des données
non structurées telles que les textes, les commentaires, les avis ou les réseaux sociaux.
• L'analyse de réseau : cette technique permet de détecter des liens et des interactions entre des
entités dans un réseau, telles que des personnes, des objets ou des événements.
• Les techniques de stockage et de traitement distribués : cette méthode permet de stocker et de
traiter des données massives sur plusieurs serveurs en parallèle, afin de maximiser la vitesse et
l'efficacité

Vous aimerez peut-être aussi