Exemples :
température =35°
âge = 2 mois
Exemples:
Une connaissance est une information nouvelle, apprise par association d’informations de base, de
règles, de raisonnement, d’expérience, d’expertise, etc.
l’intuition,
les capacités humaines d’analyse,
et remet en cause l’utilisation des outils informatiques classiques.
« Données de très grande taille, dont la manipulation et gestion présentent des enjeux du point de
vue logistiques»
« Englobe tout terme pour décrire toute collection de données tellement volumineuse et complexe
qu’il devient difficile de la traiter en utilisant des outils classiques de traitement d’applications»
« collections de données dont la taille dépasse la capacité de capture, stockage, gestion et analyse
des systèmes de gestion de bases de données classiques»
Des entreprises qui utilisent le Big Data detienent un avantage concurrentiel potentiel sur celles qui ne
le font pas car elles sont en mesure de prendre des décisions commercial plus rapide et plus éclairé à
condition d'utiliser les données efficacement.
Par exemple
Le Big Data peut fournir aux entreprises des informations précieuses sur leurs clients qui peuvent être
utilisés pour affiner les campagnes et les techniques de marketing afin d'augmenter l'engagement des
clients et les taux de conversion
En outre l'utilisation du Big Data permet aux entreprises de se concentrer sur le client les données
historiques et en temps réel peuvent être utilisés pour évaluer l'évolution des préférences des
consommateurs ce qui permet aux entreprises d'actualiser et d'améliorer leur stratégie de marketing et de
me répondre au désir et au besoin des clients
Les chercheurs en médecine utilise également le Big Data pour identifier les facteurs de risque des
maladies et les médecins pour aider à diagnostiquer les maladies et symptômes chez les patients .
dans le secteur de l'énergie le Big Data aide les compagnies pétrolières et gazières à identifier les
emplacements de forage potentiel et à surveiller l'exploitation des pipeline
de même les services publics les utilise pour suivre les réseaux électriques
les sociétés de services financiers utilise le Big Data pour la gestion des risques et l'analyse en temps réel
des données du marché
les fabricants et les sociétés de transport s'appuie dessus pour gérer leur chaîne d'approvisionnement et
optimiser les itinéraires de livraison
les pouvoirs publics utilise également ses données pour les intervention d'urgence la prévention de la
criminalité et les initiatives de ville intelligente les fameuses Smart City
Évolution de la technologie
Par exemple:
Gouvernement
Industries
Services : transports, météo, …
Volumes de données croissants de tous types, qui se comptent en téraoctets ou même en pétaoctets
Variété (Variety)
Parfois, les données doivent être saisies et traitées au fur et à mesure de leur collection
*Plus récemment plusieurs autres V on été ajoutées aux différents description du Big Data notamment *
la véracité
la valeur et
la variabilité
Bien que le Big Data ne possède pas un volume spécifique de données l'utilisation du Big Data
implique souvent des
téraoctet,
des petaoctet et
même des exaoctet de données capturer au fil du temps
Le volume
le volume est la caractéristique la plus souvent cité du Big Data un environnement de données
volumineuse ne doit pas nécessairement contenir une grande quantité de données mais la plupart le fond
en raison de la nature des données qui sont recueillies et stocker. Les clics, les recherches et les systèmes
de traitement des flux sont parmi les sources qui produisent généralement des volumes massif de données
de manière continue**
- Donneés non structurées tel que les fichiers textes et documents conservés dans
des clusters hadoop ou des systèmes de base de données NoSQL. hadoop est un frame
work libre et Open Source écrit en Java destiné à faciliter la création d'applicat
ion distribuer et scalable permettant aux applications de travailler avec des mill
iers de nœud et des petaoctet données
- Les données semi-structurées tels que les journeaux des serveux web ou des donné
es en continues
Toutes les variétés peuvent être stokés dans un lac de données : hadoop, ou service de stochage dans
le clusters (Amazone S3)
La Volocité fait référence à la vitesse à laquelle les données sont générées et doivent être traitées et
Analysés.
ou encore
Valeur (Value)
La valeur ajoutée des données ou des informations extraites
Sans une réelle valeur, ce n’est qu’un gaspillage de ressources
Véracité (Veracity)
variabilité
Enfin, à quelle vitesse la structure de vos données change-t-elle? Et à quelle fréquence la forme de vos
données change-t-elle?
L’important est d’établir si la structure contextuelle du flux de données est régulière et
fiable même dans des conditions d’imprévisibilité extrême. La variabilité définit la nécessité d’obtenir des
données significatives en tenant compte de toutes les circonstances possibles.
C’est particulièrement le cas lorsque la collecte de données repose sur le traitement de la langue. Brian
Hopkins, analyste principal de Forrester, a cité le supercalculateur Watson comme un excellent exemple de
cela. Pour participer au jeu télévisé Jeopardy, Watson devait «disséquer une réponse dans son sens et […]
pour déterminer quelle était la bonne question». Les mots n’ont pas de définitions statiques et leur signification
peut varier énormément dans le contexte.
La conception d'une architecture big data répond d'abord à la question de savoir comment stocker pur
et simplement mes données brutes. Il s'agit pour être plus spécifique de répondre aux 3 questions
suivantes:
Chapitre 3 : Stocker les données collectées en utilisant les solutions SQL et NoSQL (MySQL, Elasticsearch,
Kibana)