Académique Documents
Professionnel Documents
Culture Documents
Le Big Data
Le terme mme de Big Data a t voqu la premire fois par le cabinet dtudes Gartner en 2008 mais des traces de la gense de ce
terme remontent 2001 et ont t voques par le cabinet Meta Group.
Il fait rfrence lexplosion du volume des donnes (de par leur nombre, la vitesse laquelle elles sont produites et leur varit) et
aux nouvelles solutions proposes pour grer cette volumtrie tant dans la capacit stocker et explorer celles-ci que, rcemment, la
capacit analyser et exploiter ces donnes dans une approche temps rel.
Il ny aurait que 10% de donnes structures en entreprise, la quasitotalit constituant ce remarquable bazar ambiant qui va de la messagerie
lectronique, en passant par les .pdf, les .ppt et autres joyeuses abrviations
dsignant aussi bien des fichiers texte, quaudio ou vido.
Aubay - Suivez toute lactualit Aubay sur notre web TV, twitter et notre site Internet www.aubay.com
On appelle ontologie un ensemble structur de termes et de concepts reprsentant le sens dun champ dinformations. Applique au Text
Miming il sagit donc dun modle de donnes conceptualis sous forme de graphe qui dfinit lensemble des concepts lis un domaine et la faon
dont sont lis ces concepts (cf. notion de concept et relation).
1
La notion de concept et relation est issue de la smantique sur laquelle reposent les solutions des Text Mining. Elle dfinit lextraction de motscls issus dun langage courant ou spcifique un mtier (les concepts) et de liens entre ces mots-cls dtermins partir de la structure grammaticale dune phrase ou dun paragraphe (les relations).
2
Document Store
Graph
Bien sr, les solutions de SGBD plus classiques restent utilisables de par lvolution de leur architecture. Cest le cas
pour les bases relationnelles, les bases objets, les bases multidimensionnelles, dont les capacits ont volu au travers des
architectures massivement parallles ou InMemory3.
Le terme InMemory dsigne les nouvelles architectures de gestion de bases de donnes (IMDB) qui utilisent la mmoire vive des serveurs pour
le stockage des donnes, permettant ainsi un accs plus rapide celles-ci. De plus, les IMDB grent la rpartition des donnes sur plusieurs serveurs
et leur rplication sur des supports de stockage physique (HDD, SDD, etc.) afin de garantir le support ACID (Atomicity, Consistency, Isolation, Durability) indispensable un SGBD.
3
www.youtube.com/AubayTV
@groupeaubay
www.aubay.com nos offres demploi et de stage