Académique Documents
Professionnel Documents
Culture Documents
monde de l’entreprise : big data, data mining, machine learning. Dans cette partie, on va
essayer de vous expliquer la différence de sens entre ces termes techniques.
Le big data
Le big data, ou méga données en français, c’est un peu le socle commun de tous les
concepts. Aujourd’hui, de plus en plus de données sont stockées sur les serveurs par les
entreprises : les données sur la production, les ventes, les données clients, les données
comptables, etc. L’utilisation croissante des réseaux sociaux et des objets connectés
participent activement à cette collecte massive des données sur les comportements des
utilisateurs.
Mais le big data n’est pas seulement une affaire des volumes importants des données :
cela renvoie aussi à la très grande variété des informations (du texte, des chiffres, des
images, des vidéos, des likes, des tweets…) et à la vitesse à laquelle les données sont
générées. Par exemple, sur Facebook, vous n’avez pas besoin d’attendre 3 jours pour
recevoir les dernières statistiques de votre page car les données sont mises à jour en
temps réel. On parle généralement des « 3V » du big data : Volume, Vitesse, Variété, ce
modèle toujours d’actualité fut complété par IBM qui a ajouté un 4eme V la véracité des
données cad leur fiabilité et leur qualité. Plus récemment, 4 nouvelles dimensions
pertinentes ont été ajoutées : la valeur (cad les valeurs que représentent ces données
apportent de nouvelles connaissances), la visibilité des données à travers des tableaux
récapitulatifs, la datavisualisation (concerne la représentation des données sous formes
intelligentes, pratiques et interactives) et les opportunités offertes par la gestion de ces
données en termes d’économie d’échelle et de métier.
Le data mining
Parce que les données en disent beaucoup sur les préférences des clients, elles
constituent des enjeux commerciaux et marketing pour l’entreprise. Le data mining,
littéralement extraction de données, peut etre défini comme étant le procédé qui
permet de trouver des corrélations entre de nombreuses bases de données
relationnelles.
On peut résumer le processus du data mining comme étant est une technique qui
permet d’extraire et d’analyser les big data pour en tirer des informations pertinentes.
Très simplement, les logiciels de data mining traitent l’immense quantité de données
pour en faire ressortir des tendances, des modèles, des corrélations.
Les modèles et les corrélations établis par le data mining permettent non seulement de
comprendre le présent, mais aussi d’anticiper les comportements.
Le machine learning
Le machine learning, ou apprentissage automatique, va encore plus loin que le data
mining. Ce dernier établit des tendances pour comprendre et anticiper, puis les
humains prennent des décisions. Avec le machine learning, la prise de décision
devient artificielle : il n’y a pas d’humain pour prendre les décisions, c’est la machine
qui décide automatiquement.
En fait, le machine learning est un logiciel programmé par des humains qui permet
ensuite à la machine de fonctionner de manière autonome. Sa force est de s’appuyer
sur des algorithmes afin de traiter les données et apprendre des règles au fur et à
mesure. En mars 2016, la victoire 4-1 d’AlphaGo (un logiciel développé par Google)
face à un champion de go coréen est un exemple des capacités extraordinaires du
machine learning.
On peut aussi citer l’exemple d’Amazon et Netflix qui, à partir de nos recherches et
nos commandes précédentes, proposent des livres, des films, des séries et des
musiques qui correspondent parfaitement à nos goûts personnels.